一种表格标注的方法和系统

基本信息

申请号 CN202010637317.1 申请日 -
公开(公告)号 CN111881769A 公开(公告)日 2020-11-03
申请公布号 CN111881769A 申请公布日 2020-11-03
分类号 G06K9/00(2006.01)I 分类 计算;推算;计数;
发明人 万林;张百灵;周炬;马成龙 申请(专利权)人 苏州开心盒子软件有限公司
代理机构 北京尚伦律师事务所 代理人 苏州开心盒子软件有限公司
地址 215123江苏省苏州市苏州工业园区星湖街328号创意产业园6-604
法律状态 -

摘要

摘要 本发明公开了一种表格标注的方法和系统,该方法包括对包含有表格的文档图像进行二值化,获得文档二值图像;从文档二值图像中提取文档图像的横线,获得第一图像;从文档二值图像中提取文档图像的竖线,获得第二图像;将第一图像和第二图像进行叠加,并进行轮廓检测,得到轮廓的外截矩形,获得表格的单元格;对单元格中信息进行内容识别,获得单元格内容;将检测到的表格的单元格位置信息和识别出来的单元格内容信息输入到标注工具,获得表格标注结果。采用了本发明的技术方案,能够保证预标注的单元格定位精确,减少人工标注中的误差,而且在预标注的基础上进行二次修改标注,提高了标注速度,节约人力成本。