一种基于OCR技术的投标文件自动解析方法及系统

基本信息

申请号 CN202110689006.4 申请日 -
公开(公告)号 CN113344096A 公开(公告)日 2021-09-03
申请公布号 CN113344096A 申请公布日 2021-09-03
分类号 G06K9/62(2006.01)I;G06K9/20(2006.01)I;G06K9/34(2006.01)I 分类 计算;推算;计数;
发明人 李志慧;周国峰;高于喆;李名岩;尚晓;陈伟 申请(专利权)人 郑州信源信息技术股份有限公司
代理机构 广州一锐专利代理有限公司 代理人 甘奎强
地址 450000河南省郑州市高新技术产业开发区莲花街55号1号楼7层南侧
法律状态 -

摘要

摘要 本发明涉及信息采集管理技术领域,具体为一种基于OCR技术的投标文件自动解析方法及系统,包括服务器以及移动端,所述服务器以及移动端上均设有信息采集单元、信息分类单元、信息截取单元、图像倾斜校正单元、OCR图像识别单元以及信息输出单元,本发明根据不同类型的投标项或投标类型首先进行的是分类,确定投标文件的的类别,这样根据不同种类的投标文就可以采用固定的模板截取出待识别信息的图像,同时降低了后续识别的难度,其次针对投标文件中表现的不同分类内容使用基于图像增强的二次分割法,用于实现截取,并进行倾斜校正这样既降低了识别难度,又提高了OCR图像识别单元解析的准确率。