一种文档图像分类识别方法及装置

基本信息

申请号 CN201110101777.3 申请日 -
公开(公告)号 CN102750541B 公开(公告)日 2015-07-08
申请公布号 CN102750541B 申请公布日 2015-07-08
分类号 G06K9/62(2006.01)I;G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 马兴杰;张雪玲;张岩 申请(专利权)人 北京文通科技有限公司
代理机构 - 代理人 -
地址 100190 北京市海淀区北四环西路9号银谷大厦1609室
法律状态 -

摘要

摘要 本发明公开了一种文档图像分类识别方法及装置,根据文档图像特征分类信息,分别预设特征文件,存入票据种类特征库;对输入文档图像进行预处理;分别提取输入文档图像中的网格特征、框线特征、标题特征与文本特征,分别与票据种类特征库中特征文件进行比较,若相似度大于预设特征阈值,执行下个步骤,否则,淘汰所述特征文件,更新票据种类特征库。采用本发明技术方案,充分利用文档图像中的各种有效特征,包括粗网格特征、框线颜色、框线拓扑结构、标题颜色、标题内容、文本颜色、文本内容等多种特征,通过多层分类器逐步完成分类过程,确保文档图像分类识别的准确性。