一种文字识别方法、装置、机器可读介质及设备

基本信息

申请号 CN202111488435.1 申请日 -
公开(公告)号 CN114155536A 公开(公告)日 2022-03-08
申请公布号 CN114155536A 申请公布日 2022-03-08
分类号 G06V30/148(2022.01)I;G06V30/19(2022.01)I;G06V10/74(2022.01)I 分类 计算;推算;计数;
发明人 肖遥;陈静;许梅芳 申请(专利权)人 重庆中科云从科技有限公司
代理机构 上海光华专利事务所(普通合伙) 代理人 李铁
地址 401120重庆市渝北区卉竹路2号11幢3-8层1、2号
法律状态 -

摘要

摘要 本发明公开了一种文字识别方法,包括:获取待识别图像上记载的文本信息以及文本信息对应的位置信息;根据预设匹配规则,并基于待匹配的标题字段和内容字段从文本信息中匹配出与待匹配的标题字段和内容字段对应的候选标题字段以及候选内容字段;基于待识别对象中各标题字段之间的位置关系,对从文本信息中匹配出的候选标题字段进行组合,得到候选标题字段组合;从候选标题字段组合中确定出目标标题字段组合;根据目标标题段组合中的目标标题段以及目标标题字段与目标内容字段的位置关系确定目标内容字段。本发明可以实现多标题字段以及多匹配规则处理等功能,解决了开放版式票据模型定位精度低、开发周期长、泛化能力差等问题,具有很好的鲁棒性,在真实场景中具有高准确率。