一种基于深度学习的档案影像信息结构化构建方法及装置

基本信息

申请号 CN202011398958.2 申请日 -
公开(公告)号 CN112541490A 公开(公告)日 2021-03-23
申请公布号 CN112541490A 申请公布日 2021-03-23
分类号 G06N3/08(2006.01)I;G06K9/20(2006.01)I;G06K9/34(2006.01)I;G06N3/04(2006.01)I;G06T5/00(2006.01)I 分类 计算;推算;计数;
发明人 曹孟君;曾智;胡磊;陈韵;卢强;孙颖;邹瑶;刘小保;黎浩云;才翔;宋莎 申请(专利权)人 广州城市规划技术开发服务部有限公司
代理机构 广州三环专利商标代理有限公司 代理人 颜希文;郝传鑫
地址 510000广东省广州市越秀区洪桥街东风中路300号之一19楼西
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习的档案影像信息结构化构建方法及装置,该方法包括如下步骤:步骤S1,获取档案图片,对所述档案图片进行预处理,获得档案图片样本;步骤S2,对档案图片样本进行人工文本定位标注,提取关键词,进行文本识别,并通过多次学习的方式构建端到端的深度学习模型,并使用训练样本进行训练,得到最终的档案影像信息构建模型;步骤S3,输入待识别档案图片,经训练好的档案影像信息构建模型进行文字的定位、识别和关键词提取,将输出内容保存为预设格式,并提取至标注库文件;步骤S4,通过标注库工具进行提取、入库存储进行结构化构建。