一种文字识别编校方法
基本信息
申请号 | CN201810493009.9 | 申请日 | - |
公开(公告)号 | CN108710855A | 公开(公告)日 | 2018-10-26 |
申请公布号 | CN108710855A | 申请公布日 | 2018-10-26 |
分类号 | G06K9/00;G06K9/32;G06K9/54;G06F17/27 | 分类 | 计算;推算;计数; |
发明人 | 员战强;王长征;胡志强;师峰;刘文晓;梁询 | 申请(专利权)人 | 山西同方知网数字出版技术有限公司 |
代理机构 | 北京天奇智新知识产权代理有限公司 | 代理人 | 山西同方知网数字出版技术有限公司 |
地址 | 030006 山西省太原市高新区产业路48号新岛科技园D座 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种文字识别编校方法,包括:对文档图片进行图像预处理;对图像预处理后的文档图片通过多路识别引擎对文档中的文字进行识别,得到文字识别结果;对识别的文字结果进行归一化处理;自动纠正识别的文字内容;对识别存疑的内容进行人工编校。本发明对以文字为主体的文档的识别系统错误率控制在0.005%‑0.3%,并且,在人工编校工作中,可将需要人工编校的文字量控制在3%‑5%。 |
