一种多语种保单自动识别的控制算法及装置

基本信息

申请号 CN201911220970.1 申请日 -
公开(公告)号 CN110909728A 公开(公告)日 2020-03-24
申请公布号 CN110909728A 申请公布日 2020-03-24
分类号 G06K9/20;G06K9/62;G06N3/04 分类 计算;推算;计数;
发明人 刘祥峰;毛国庆;覃亚芬 申请(专利权)人 中国太平洋保险(集团)股份有限公司
代理机构 上海宝鼎专利代理有限公司 代理人 张宝让
地址 200010 上海市黄浦区中山南路1号
法律状态 -

摘要

摘要 本发明公开了一种多语种保单自动识别的控制算法,包括如下步骤:a.基于神经网络引擎对所述保单中的文字信息进行训练,并获得文字区域信息;b.对相邻两个文字的区域信息进行面积区域计算,并将所述两个文字的区域信息所对应面积之和与所述两个文字最大外接矩阵所对应的总面积之比例K大于第一阈值的所述两个文字区域信息进行处理以获得段落文字区域信息;c.基于一个或多个所述段落文字区域信息进行合并处理,从而获得段落文字;d.至少输出所述段落文字。本发明通过对多种类型的保单进行统一处理,提取目标文字,提高工作效率,降低工作成本,本发明操作简单、使用方便,具有极高的商业价值。