基于银行回单的关键信息提取方法、装置、设备及介质

基本信息

申请号 CN202110042586.8 申请日 -
公开(公告)号 CN112784720A 公开(公告)日 2021-05-11
申请公布号 CN112784720A 申请公布日 2021-05-11
分类号 G06K9/00;G06F40/247;G06F40/289;G06F16/35 分类 计算;推算;计数;
发明人 何依伦 申请(专利权)人 浙江诺诺网络科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 侯珊
地址 310000 浙江省杭州市西湖区双龙街199号金色西溪商务中心A座8层
法律状态 -

摘要

摘要 本发明公开了一种基于银行回单的关键信息提取方法,包括:识别银行回单的初始文字字段;对初始文字字段执行清洗操作,得到目标文字字段;对相邻的目标文字字段间建立动态链接,生成文字字段组合;识别每个文字字段组合的类型,并通过机器学习模型从每个文字字段组合中提取所述银行回单的关键信息。可见,在本方案中,识别银行回单的初始文字字段后,通过对初始文字字段清洗的方式,可避免提取的关键信息出现字段错误、不完整等问题,通过建立文字字段组合的方式,可提高字段间的关联度,从而提高关键信息的完整性和准确性;本发明还公开了一种基于银行回单的关键信息提取装置、设备及介质,同样能实现上述技术效果。