一种新闻内容全文检索引擎的构建方法及装置

基本信息

申请号 CN201810523561.8 申请日 -
公开(公告)号 CN108804594A 公开(公告)日 2018-11-13
申请公布号 CN108804594A 申请公布日 2018-11-13
分类号 G06F17/30 分类 计算;推算;计数;
发明人 李雄;张传新;刘春阳;张旭;王萌;王慧;王利军;李磊 申请(专利权)人 北京天润基业科技发展股份有限公司
代理机构 北京慧泉知识产权代理有限公司 代理人 国家计算机网络与信息安全管理中心;北京天润基业科技发展股份有限公司
地址 100029 北京市朝阳区裕民路甲3号
法律状态 -

摘要

摘要 本发明涉及一种新闻内容全文检索引擎的构建方法及装置,该方法步骤如下:获取带有实时访问信息的实时网站日志;获取带有新闻热度评论信息的新闻网站的数据;对所述实时网站日志和所述新闻网站数据分类;对分类后的所述新闻网站数据进行处理、索引并存储;获取新闻网站数据中国的新闻元信息并存储;获取新闻网站数据中的热度信息进行存储,并对新闻网站数据中的热度信息统计。本发明在查询性能、索引空间和构建性能方面实现了合理的平衡;考虑到统计数据随时间变化的特性,动态更新索引结果;提高了系统的健壮性;提高统计数据与文本数据的复合查询性能。