一种词语相似度计算方法、装置以及存储介质
基本信息
申请号 | CN201910830820.6 | 申请日 | - |
公开(公告)号 | CN110633356A | 公开(公告)日 | 2019-12-31 |
申请公布号 | CN110633356A | 申请公布日 | 2019-12-31 |
分类号 | G06F16/33(2019.01); G06F17/27(2006.01) | 分类 | 计算;推算;计数; |
发明人 | 曾万贵; 黄俊钧 | 申请(专利权)人 | 广州市巴图鲁信息科技有限公司 |
代理机构 | 广州三环专利商标代理有限公司 | 代理人 | 郭浩辉;麦小婵 |
地址 | 510000 广东省广州市海珠区沥滘路368号17层整层单元 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种词语相似度计算方法,所述方法包括:获取第一词语和第二词语的交并比、所述第一词语的长度、所述第二词语的文字在所述第一词语的聚合度、所述第二词语的文字在所述第一词语的前置匹配度;利用预设词语相似度算法计算所述第一词语与所述第二词语之间的相似度;所述第一词语的数量为若干个,将所述若干个第一词语与所述第二词语之间的相似度进行排序。本发明还公开了词语相似度计算装置、设备以及存储介质。采用本发明,可以从词语的交并比、长度、聚合度、前置匹配度等方面去评价其相似性,提高了计算词语之间相似度的准确性。 |
