一种基于图知识库的分布式信息检索集合选择方法

基本信息

申请号 CN201710228718.X 申请日 -
公开(公告)号 CN107133274B 公开(公告)日 2020-12-15
申请公布号 CN107133274B 申请公布日 2020-12-15
分类号 G06F16/33;G06F16/36;G06F40/295;G06F40/30 分类 计算;推算;计数;
发明人 吴勇;陈岭;韩保礼;季海琦;郑羽 申请(专利权)人 浙江鸿程计算机系统有限公司
代理机构 杭州之江专利事务所(普通合伙) 代理人 张慧英
地址 310053 浙江省杭州市滨江区浦沿街道伟业路1号2幢
法律状态 -

摘要

摘要 本发明涉及一种基于图知识库的分布式信息检索集合选择方法,主要包括如下步骤:1)采用实体链接方法,从各个集合的样本文档中获取集合的实体词集;2)基于上下文相关度和结构相关度,计算实体词的权重,使用加权的实体词集表示集合的语义信息;3)采用查询扩展方法扩展查询中包含的实体词,并为查询实体词赋予不同的权重;4)采用查询与集合相关度度量方法计算集合评分,选择评分较高的前若干个集合。本发明利用图知识库中蕴含的实体关系和网络结构,使用基于图知识库的集合语义建模方法、查询扩展方法和查询与集合相关度度量方法,提高了集合选择方法的准确度。