文档结构化方法、系统、终端及介质
基本信息
申请号 | CN202011441141.9 | 申请日 | - |
公开(公告)号 | CN112597773A | 公开(公告)日 | 2021-04-02 |
申请公布号 | CN112597773A | 申请公布日 | 2021-04-02 |
分类号 | G06F40/295(2020.01)I;G06F40/151(2020.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 周异;周曲;韦建;何建华 | 申请(专利权)人 | 上海深杳智能科技有限公司 |
代理机构 | 上海恒慧知识产权代理事务所(特殊普通合伙) | 代理人 | 刘翠 |
地址 | 200240上海市闵行区零号湾科技1号楼1109室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种文档结构化方法及系统,包括:获取文档的文字区块以及文字字段;其中,所述文字区块包括位置框,所述文字字段包括位置框和文本内容;基于所述文字区块的位置框和文字字段的位置框,对所述文本内容进行排列;基于所述文本内容的排列结果,进行结构化信息提取;根据提取的结构化信息,建立结构化文档。同时提供了一种对应的终端及存储介质。本发明能够突破基于图像目标检测必须使用固定文档模板的局限性,并提高文字检测识别方法的准确性。 |
