文本相似度计算方法及装置
基本信息
申请号 | CN201811497301.4 | 申请日 | - |
公开(公告)号 | CN109344245B | 公开(公告)日 | 2019-07-23 |
申请公布号 | CN109344245B | 申请公布日 | 2019-07-23 |
分类号 | G06F16/332;G06F17/27;G06F17/22 | 分类 | 计算;推算;计数; |
发明人 | 杨凯程;李健铨;蒋宏飞 | 申请(专利权)人 | 安徽省泰岳祥升软件有限公司 |
代理机构 | 北京弘权知识产权代理事务所(普通合伙) | 代理人 | 逯长明;许伟群 |
地址 | 230088 安徽省合肥市高新区习友路3333号中国(合肥)国际智能语音产业园研发中心楼405-5室 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例提供了一种文本相似度计算方法及装置,本发明实施例首先获取两个文本的最长公共子序列,之后对两个文本对应的词汇集合计算交集和并集,之后根据得到的交集和并集计算得到第一相似度,利用上述最长公共子序列对应的词汇集合以及之前得到的并集计算第二相似度,最后根据第一相似度和第二相似度计算得到两个文本的目标相似度。上述技术方案结合最长公共子序列以及文本中各个词汇,计算两个文本的相似度,有效提高了文本相似度的计算精度。进一步地,利用准确的文本相似度,能够为用户提供更加准确的答复,提高了智能交互的服务质量和用户的体验度。 |
