一种科技项目相似度计算方法

基本信息

申请号 CN201310508199.4 申请日 -
公开(公告)号 CN103631858B 公开(公告)日 2017-07-21
申请公布号 CN103631858B 申请公布日 2017-07-21
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 徐小良;林建海;杨文显;陈秋 申请(专利权)人 杭州涡流科技有限公司
代理机构 杭州君度专利代理事务所(特殊普通合伙) 代理人 杭州电子科技大学
地址 310018 浙江省杭州市下沙高教园区2号大街
法律状态 -

摘要

摘要 本发明公开了一种科技项目相似度计算方法。本发明具体包括如下步骤:步骤1:提出一种规则模型并根据它识别出项目中的未登录词;步骤2:根据词的统计信息及语义信息获得关键词,与步骤1得到的未登录词组成特征词;步骤3:对两个项目名称中的特征词进行语义与字面相似度计算,如果求和并归一化后的值低于γ,则项目不相似,结束检测;步骤4:对相关词权重进行加权计算;步骤5:对主要内容中的特征词进行语义与字面相似度计算,得到两个项目主要内容的相似度;步骤6:对步骤3和步骤5的相似值加权求和得到两个项目的相似度。本发明考虑了项目申请书的语义信息,结构信息以及统计信息,该方法提高了科技项目相似度计算的准确率及效率。