基于基尼不纯度的OCR版面分析方法

基本信息

申请号 CN202110479171.7 申请日 -
公开(公告)号 CN113221880A 公开(公告)日 2021-08-06
申请公布号 CN113221880A 申请公布日 2021-08-06
分类号 G06K9/32(2006.01)I;G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06F40/189(2020.01)I 分类 计算;推算;计数;
发明人 刘星辰;何盼;陈晓峰;麻沁甜 申请(专利权)人 上海勃池信息技术有限公司
代理机构 上海科律专利代理事务所(特殊普通合伙) 代理人 叶凤
地址 201815上海市嘉定区汇源路55号8幢5层517室
法律状态 -

摘要

摘要 本发明基于基尼不纯度的OCR版面分析方法,包括:获取图像OCR初始的含位置信息和置信分的识别结果;根据置信分将所有的识别结果分为高置信度和低置信度两类;从图像的左侧开始,按照一定的间隔设置多条竖直分隔线,同样地,从图像上侧开始,按照一定的间隔设置多条水平分隔线;利用竖直分隔线将识别结果分成左右两部分,水平分隔线将识别结果分成上下两部分;对于每一条分隔线,分别计算左右或者上下两个部分的基尼不纯度,然后根据上下/左右的基尼不纯度计算总的基尼不纯度;取所有分隔线中基尼不纯度最小的线作为最终的分隔线;通过最终分隔线的位置和方向判断图像的版面,同时过滤掉高置信度文本较少一侧的文本识别结果;根据过滤后的识别结果进行字段匹配,得到最终的识别结果。