一种基于图文识别后的文字学习校对系统

基本信息

申请号 CN202110534119.7 申请日 -
公开(公告)号 CN113221886A 公开(公告)日 2021-08-06
申请公布号 CN113221886A 申请公布日 2021-08-06
分类号 G06K9/32;G06K9/40;G06K9/72 分类 计算;推算;计数;
发明人 胡耀珺 申请(专利权)人 广西安怡臣信息技术有限公司
代理机构 北京和联顺知识产权代理有限公司 代理人 贾羽洁
地址 530022 广西壮族自治区南宁市青秀区云景路38号升禾·绿城世界8栋1单元605号
法律状态 -

摘要

摘要 本发明公开了一种基于图文识别后的文字学习校对系统,包括图像处理模块、数据库、文字校对模块、文档输出模块;图像处理模块用于对纸质文档图像的扫描收集,数据库用于建立文档结构表、文档信息表、字符信息表、工作管理信息表,以及存储字符图像文件信息,文字校对模块用于字符信息与切分图像的比对,本发明通过先进的页面分析提取技术,将图像文件中的全部字符进行拆分,形成独立的字符文件,并利用数据库技术进行相应排序组合,将繁琐的校对程序改变为简单的图像和字符的批量对比,从而保证识别结果符合国家出版业校对标准,并且极大提高了校对效率,对提高司法效率有着积极作用。