一种基于图知识库的分布式信息检索集合选择方法
基本信息
申请号 | CN201710228718.X | 申请日 | - |
公开(公告)号 | CN107133274B | 公开(公告)日 | 2020-12-15 |
申请公布号 | CN107133274B | 申请公布日 | 2020-12-15 |
分类号 | G06F16/33;G06F16/36;G06F40/295;G06F40/30 | 分类 | 计算;推算;计数; |
发明人 | 吴勇;陈岭;韩保礼;季海琦;郑羽 | 申请(专利权)人 | 浙江鸿程计算机系统有限公司 |
代理机构 | 杭州之江专利事务所(普通合伙) | 代理人 | 张慧英 |
地址 | 310053 浙江省杭州市滨江区浦沿街道伟业路1号2幢 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于图知识库的分布式信息检索集合选择方法,主要包括如下步骤:1)采用实体链接方法,从各个集合的样本文档中获取集合的实体词集;2)基于上下文相关度和结构相关度,计算实体词的权重,使用加权的实体词集表示集合的语义信息;3)采用查询扩展方法扩展查询中包含的实体词,并为查询实体词赋予不同的权重;4)采用查询与集合相关度度量方法计算集合评分,选择评分较高的前若干个集合。本发明利用图知识库中蕴含的实体关系和网络结构,使用基于图知识库的集合语义建模方法、查询扩展方法和查询与集合相关度度量方法,提高了集合选择方法的准确度。 |
