字形码相似度计算方法和关键字词提取方法、系统及装置

基本信息

申请号 CN202110877695.1 申请日 -
公开(公告)号 CN113313100A 公开(公告)日 2021-08-27
申请公布号 CN113313100A 申请公布日 2021-08-27
分类号 G06K9/00;G06F40/109;G06F40/126 分类 计算;推算;计数;
发明人 张洁;周扬;刘自成 申请(专利权)人 南京智盈人工智能研究院有限公司
代理机构 南京中擎科智知识产权代理事务所(普通合伙) 代理人 韩赛
地址 210012 江苏省南京市雨花台区宁双路19号云密城2号楼13层
法律状态 -

摘要

摘要 本发明涉及字符智能识别领域,公开了字形码相似度计算方法和关键字词提取方法、系统及装置,其技术方案要点是从待识别文字图片中识别得到电子文本;在电子文本中设定要提取的关键字;根据关键字的字形码,利用字形码相似度计算方法计算关键字与字库中所有字的字形码相似度;在关键字与字库中所有字的字形码相似度得出后,找出所有与所述关键字的字形码相似度达到设定阈值的字,即为关键字的相似字;从所述电子文本中提取所述关键字和所述相似字,在图片文本识别的场景下,准确找到关键字的概率更高,更加有利于实际的使用。