一种新闻内容全文检索引擎的构建方法及装置
基本信息
申请号 | CN201810523561.8 | 申请日 | - |
公开(公告)号 | CN108804594A | 公开(公告)日 | 2018-11-13 |
申请公布号 | CN108804594A | 申请公布日 | 2018-11-13 |
分类号 | G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 李雄;张传新;刘春阳;张旭;王萌;王慧;王利军;李磊 | 申请(专利权)人 | 北京天润基业科技发展股份有限公司 |
代理机构 | 北京慧泉知识产权代理有限公司 | 代理人 | 国家计算机网络与信息安全管理中心;北京天润基业科技发展股份有限公司 |
地址 | 100029 北京市朝阳区裕民路甲3号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种新闻内容全文检索引擎的构建方法及装置,该方法步骤如下:获取带有实时访问信息的实时网站日志;获取带有新闻热度评论信息的新闻网站的数据;对所述实时网站日志和所述新闻网站数据分类;对分类后的所述新闻网站数据进行处理、索引并存储;获取新闻网站数据中国的新闻元信息并存储;获取新闻网站数据中的热度信息进行存储,并对新闻网站数据中的热度信息统计。本发明在查询性能、索引空间和构建性能方面实现了合理的平衡;考虑到统计数据随时间变化的特性,动态更新索引结果;提高了系统的健壮性;提高统计数据与文本数据的复合查询性能。 |
