基于基尼不纯度的OCR版面分析方法
基本信息

| 申请号 | CN202110479171.7 | 申请日 | - |
| 公开(公告)号 | CN113221880A | 公开(公告)日 | 2021-08-06 |
| 申请公布号 | CN113221880A | 申请公布日 | 2021-08-06 |
| 分类号 | G06K9/32(2006.01)I;G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06F40/189(2020.01)I | 分类 | 计算;推算;计数; |
| 发明人 | 刘星辰;何盼;陈晓峰;麻沁甜 | 申请(专利权)人 | 上海勃池信息技术有限公司 |
| 代理机构 | 上海科律专利代理事务所(特殊普通合伙) | 代理人 | 叶凤 |
| 地址 | 201815上海市嘉定区汇源路55号8幢5层517室 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明基于基尼不纯度的OCR版面分析方法,包括:获取图像OCR初始的含位置信息和置信分的识别结果;根据置信分将所有的识别结果分为高置信度和低置信度两类;从图像的左侧开始,按照一定的间隔设置多条竖直分隔线,同样地,从图像上侧开始,按照一定的间隔设置多条水平分隔线;利用竖直分隔线将识别结果分成左右两部分,水平分隔线将识别结果分成上下两部分;对于每一条分隔线,分别计算左右或者上下两个部分的基尼不纯度,然后根据上下/左右的基尼不纯度计算总的基尼不纯度;取所有分隔线中基尼不纯度最小的线作为最终的分隔线;通过最终分隔线的位置和方向判断图像的版面,同时过滤掉高置信度文本较少一侧的文本识别结果;根据过滤后的识别结果进行字段匹配,得到最终的识别结果。 |





