文档图像识别装置及方法

基本信息

申请号 CN202110272091.4 申请日 -
公开(公告)号 CN113033360A 公开(公告)日 2021-06-25
申请公布号 CN113033360A 申请公布日 2021-06-25
分类号 G06K9/00;G06K9/34;G06K9/62 分类 计算;推算;计数;
发明人 唐中良;曹永刚 申请(专利权)人 理光图像技术(上海)有限公司
代理机构 上海德昭知识产权代理有限公司 代理人 郁旦蓉
地址 200233 上海市徐汇区桂菁路7号3号楼4F
法律状态 -

摘要

摘要 本发明提供一种文档图像识别装置及方法,用于对包含复数页文档图像的文档进行页眉和页脚的识别,其特征在于,文档图像识别装置包括:待判定图像形成部,将每一页文档图像分割形成多个待判定图像;区域判定获取部,判定出各个文档图像中位置相互对应的待判定图像,并获取该待判定图像在文档图像中相对应的区域作为待判定区域;相似度判定部,依次判定待判定区域在各个文档图像中对应的待判定图像的相似度是否高于预定相似阈值;以及页眉页脚识别部,将被判定为相似度高于预定相似阈值的待判定区域且位于文档图像上方的待判定区域识别为页眉区域,并将被判定为相似度高于预定相似阈值的待判定区域且位于文档图像下方的待判定区域识别为页脚区域。