基于垂直搜索引擎的数字内容查询系统

基本信息

申请号 CN201710690520.3 申请日 -
公开(公告)号 CN107451289A 公开(公告)日 2017-12-08
申请公布号 CN107451289A 申请公布日 2017-12-08
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 贺麟;杨霖;李丽琴;肖智宽 申请(专利权)人 四川汇源吉迅数码科技有限公司
代理机构 成都九鼎天元知识产权代理有限公司 代理人 四川汇源吉迅数码科技有限公司
地址 610031 四川省成都市青羊区外南人民路131号
法律状态 -

摘要

摘要 本发明公开了一种基于垂直搜索引擎的数字内容查询系统,该系统包括主节点服务器和多个从节点服务器,主节点服务器包括管理器和查询器,从节点服务器包括爬行器和索引器;管理器用于分割待爬行的网页的网页链接得到多个网页子链接,并将网页子链接分配给多个从节点服务器;爬行器用于按照分割的网页子链接抓取网页文本数据,并将网页子链接和网页文本数据绑定后保存到网页数据库中:索引器用于对网页数据库中的网页数据进行分词,并按照分词执行全文索引得到索引结果;查询器用于解析用户的查询请求得到查询关键词和查询条件,根据查询关键词和查询条件生成查询任务,并执行查询任务获得查询结果。本发明能够大幅提高用户的查询性能。