一种基于深度学习的自由格式文档识别方法专利查询专利号|摘要-满商公司网

一种基于深度学习的自由格式文档识别方法

基本信息

申请号	CN202011168354.9	申请日	-
公开（公告）号	CN112348022A	公开（公告）日	2021-02-09
申请公布号	CN112348022A	申请公布日	2021-02-09
分类号	G06K9/34(2006.01)I;	分类	计算；推算；计数;
发明人	王文锋;傅启予;韩光祖;秦泽文;邓梁;朱志童	申请（专利权）人	富邦华一银行有限公司
代理机构	上海翰信知识产权代理事务所（普通合伙）	代理人	张维东
地址	200120上海市浦东新区自由贸易试验区世纪大道1168号A座101室、18楼、19楼及20楼
法律状态	-

摘要

本发明涉及一种基于深度学习的自由格式文档识别方法，包括以下步骤：定义模板，所述模板中包含多个矩形碎片的坐标位置；获取待识别文档；OCR引擎全文识别，以判断待识别文档所属模板；调用模板中所有矩形碎片的坐标位置，采用YOLO目标检测模型将模板中所有矩形碎片及其坐标位置对应在待识别文档中；根据矩形碎片及其坐标位置切割待识别文档，形成多个碎片文件；将多个碎片文件存入数据库，并将多个碎片文件传入消息队列中；OCR引擎继续识别消息队列中的碎片文件，得到识别结果；返回碎片文件和识别结果到数据库；完成识别。本发明通过两次采用OCR引擎进行识别，提高了识别的准确率；还通过提前定义模板及矩形碎片等，从而明确被识别内容的作用和意义。