一种文档图像分类识别方法及装置
基本信息
申请号 | CN201110101777.3 | 申请日 | - |
公开(公告)号 | CN102750541B | 公开(公告)日 | 2015-07-08 |
申请公布号 | CN102750541B | 申请公布日 | 2015-07-08 |
分类号 | G06K9/62(2006.01)I;G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 马兴杰;张雪玲;张岩 | 申请(专利权)人 | 北京文通科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 100190 北京市海淀区北四环西路9号银谷大厦1609室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种文档图像分类识别方法及装置,根据文档图像特征分类信息,分别预设特征文件,存入票据种类特征库;对输入文档图像进行预处理;分别提取输入文档图像中的网格特征、框线特征、标题特征与文本特征,分别与票据种类特征库中特征文件进行比较,若相似度大于预设特征阈值,执行下个步骤,否则,淘汰所述特征文件,更新票据种类特征库。采用本发明技术方案,充分利用文档图像中的各种有效特征,包括粗网格特征、框线颜色、框线拓扑结构、标题颜色、标题内容、文本颜色、文本内容等多种特征,通过多层分类器逐步完成分类过程,确保文档图像分类识别的准确性。 |
