一种科技项目相似度计算方法
基本信息
申请号 | CN201310508199.4 | 申请日 | - |
公开(公告)号 | CN103631858B | 公开(公告)日 | 2017-07-21 |
申请公布号 | CN103631858B | 申请公布日 | 2017-07-21 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 徐小良;林建海;杨文显;陈秋 | 申请(专利权)人 | 杭州涡流科技有限公司 |
代理机构 | 杭州君度专利代理事务所(特殊普通合伙) | 代理人 | 杭州电子科技大学 |
地址 | 310018 浙江省杭州市下沙高教园区2号大街 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种科技项目相似度计算方法。本发明具体包括如下步骤:步骤1:提出一种规则模型并根据它识别出项目中的未登录词;步骤2:根据词的统计信息及语义信息获得关键词,与步骤1得到的未登录词组成特征词;步骤3:对两个项目名称中的特征词进行语义与字面相似度计算,如果求和并归一化后的值低于γ,则项目不相似,结束检测;步骤4:对相关词权重进行加权计算;步骤5:对主要内容中的特征词进行语义与字面相似度计算,得到两个项目主要内容的相似度;步骤6:对步骤3和步骤5的相似值加权求和得到两个项目的相似度。本发明考虑了项目申请书的语义信息,结构信息以及统计信息,该方法提高了科技项目相似度计算的准确率及效率。 |
