一种基于图像识别技术的手册提取结构化数据并快速归档的方法

基本信息

申请号 CN202011583402.0 申请日 -
公开(公告)号 CN112686262A 公开(公告)日 2021-04-20
申请公布号 CN112686262A 申请公布日 2021-04-20
分类号 G06N20/00(2019.01)I;G06F40/242(2020.01)I;G06K9/20(2006.01)I;G06K9/34(2006.01)I 分类 计算;推算;计数;
发明人 赖国伟;胡建敏 申请(专利权)人 广州博士信息技术研究院有限公司
代理机构 广州博士科创知识产权代理有限公司 代理人 李永锋
地址 510000广东省广州市高新技术产业开发区科学城科珠路203号1201D
法律状态 -

摘要

摘要 本发明提供一种基于图像识别技术的手册提取结构化数据并快速归档的方法,包括S1)、在系统中预先构建需要采集构建的数据源的字段,从而使在数据源中的数据能够与系统字段对应上;S2)、利用数据采集设备采集数据源;S3)、利用在线框选要采集识别的字段,通过人工智能图片识别算法将所选字段映射到相应列表中;S4)、将数据保存入库。本发明实现数据源快速转完成电子文档的功能;本发明通过机器学习,能够自主的识现生僻字的统一训练,可以随时替换与完善词库;本发明能够自主的框选识别,大大提高灵活度。