一种基于深度学习模型的纸质表格转word文档的方法
基本信息
申请号 | CN202110939325.6 | 申请日 | - |
公开(公告)号 | CN113705395A | 公开(公告)日 | 2021-11-26 |
申请公布号 | CN113705395A | 申请公布日 | 2021-11-26 |
分类号 | G06K9/00(2006.01)I;G06F40/174(2020.01)I;G06F40/18(2020.01)I;G06F1/18(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 叶海亮 | 申请(专利权)人 | 南京英诺森软件科技有限公司 |
代理机构 | 南京普睿益思知识产权代理事务所(普通合伙) | 代理人 | 何薇 |
地址 | 210000江苏省南京市鼓楼区中央路201号金茂广场南塔12A03 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于深度学习模型的纸质表格转word文档的方法,属于图像处理、人工智能技术领域,本方案根据表格提取的结果对表格图像中的文本信息进行提取,并填入word表格相应位置,本申请能够将各类纸质文档中的表格以很高的还原度转换为可编辑的word电子文档,能够帮助中大型企业解决纸质文件大量堆积、文件检索耗时耗力的问题,实现纸质文件的电子化管理,在技术层面下,相比现有方法,采用了特殊的数据增强手段,不但能够降低人工标注成本,在表格线提取方面具有更好的鲁棒性和精度,并且能够实现表格线隐藏和表格线为双线的表格提取。 |
