文字检索方法及装置

基本信息

申请号 CN201511009801.5 申请日 -
公开(公告)号 CN105677718B 公开(公告)日 2019-04-09
申请公布号 CN105677718B 申请公布日 2019-04-09
分类号 G06F16/53(2019.01)I 分类 计算;推算;计数;
发明人 王晓健; 江世盛 申请(专利权)人 北京汉王数字科技有限公司
代理机构 北京奉思知识产权代理有限公司 代理人 吴立;邹轶鲛
地址 100193 北京市海淀区东北旺西路8号5号楼三层
法律状态 -

摘要

摘要 本发明涉及一种利用图像匹配进行文字检索的方法及装置。所述方法包括:输入待检索文字的表意文字描述序列;对所述待检索文字的表意文字描述序列进行文本匹配,若文本匹配失败则启动图像匹配方法;即解析所述待检索文字的表意文字描述序列,根据解析获得的表意文字描述符和CJK字符绘制第一文字图像;以及遍历文档中存在的表意文字描述序列,对每次遍历到的表意文字描述序列进行解析,根据解析获得的表意文字描述符和CJK字符绘制第二文字图像。最后,将所述第一文字图像与第二文字图像进行图像匹配,根据匹配结果确定检索结果。所述检索方法及装置能够避免因表意文字描述序列的歧义所导致的文字检索失败。