基于机器学习识别图纸内图例及文字的方法及系统
基本信息
申请号 | CN202010028706.4 | 申请日 | - |
公开(公告)号 | CN111242024A | 公开(公告)日 | 2020-06-05 |
申请公布号 | CN111242024A | 申请公布日 | 2020-06-05 |
分类号 | G06K9/00(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 林希;宋楠;谢宏 | 申请(专利权)人 | 北京互时科技股份有限公司 |
代理机构 | 北京纽乐康知识产权代理事务所(普通合伙) | 代理人 | 张朝元 |
地址 | 100193北京市海淀区东北旺西路8号中关村软件园8号楼二层234 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于机器学习识别图纸内图例及文字的方法及系统,该方法包括以下步骤:S1 运用数据集构建包含图例特征的图例训练集与包含文字特征的文字训练集;S2 运用数据集和卷积神经网络获取识别图例及识别文字的神经网络模型;S3 采用S2中建立的神经网络模型获取图纸中的图例及文字。本发明的有益效果:通过已有图纸生成图例训练集及文字训练集,运用图例训练集与文字训练集对待识别图例与待识别文字进型预训练,获得识别文字区域与识别图例区域的神经网络模型,同时运用规则分类文字及建立文字与图例之间的关系,基于深度学习技术完成图例与文字的训练数据以及自动生成学习特征和模型参数,以满足不同场景的文本及图例的识别与提取。 |
