一种新闻标题相似度识别方法
基本信息
申请号 | CN202110948184.4 | 申请日 | - |
公开(公告)号 | CN113836886A | 公开(公告)日 | 2021-12-24 |
申请公布号 | CN113836886A | 申请公布日 | 2021-12-24 |
分类号 | G06F40/194(2020.01)I;G06F40/258(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 王欢;马云腾;夏茂晋 | 申请(专利权)人 | 北京清博智能科技有限公司 |
代理机构 | 合肥兆信知识产权代理事务所(普通合伙) | 代理人 | 孟祥龙 |
地址 | 100089北京市海淀区花园路5号133幢13层1301 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种新闻标题相似度识别方法,包括以下步骤:1.输入两个标题;2.对两个标题中的特殊字符进行剔除;3.对剔除后的标题内容进行相同字符统计,得出相同字数;4.计算相同字符数与最短的标题的比值,比值大于0.5即判定为相似,否则判定为不相似:本发明方法简单,快速,可移植强。 |
