一种基于语义相似性分析的技术文件相似性排查方法

基本信息

申请号 CN202010243767.2 申请日 -
公开(公告)号 CN111507105A 公开(公告)日 2020-08-07
申请公布号 CN111507105A 申请公布日 2020-08-07
分类号 G06F40/289;G06F40/30;G06K9/62 分类 -
发明人 邱再德;董琼琼;许薇薇;董德祥 申请(专利权)人 安徽中知众创知识产权运营有限公司
代理机构 合肥市长远专利代理事务所(普通合伙) 代理人 安徽中知众创知识产权运营有限公司
地址 230000 安徽省合肥市高新区黄山路601号科技创新公共服务中心105室
法律状态 -

摘要

摘要 本发明提出的一种基于语义相似性分析的技术文件相似性排查方法,从待分析的两份文件中各抽取一个关键词形成词语组合,结合罗列出的所有词语组合的相似度计算待分析的两份文件相似性评估值;词语组合的相似度为其包含的两个关键词之间的相似度。本发明提出的一种基于语义相似性分析的技术文件相似性排查方法,在计算待分析的两份文件之间的文本相似度时,根据关键词组合进行分析,使得相似度的计算更加清晰明确。