基于垂直搜索引擎的数字内容查询系统
基本信息
申请号 | CN201710690520.3 | 申请日 | - |
公开(公告)号 | CN107451289A | 公开(公告)日 | 2017-12-08 |
申请公布号 | CN107451289A | 申请公布日 | 2017-12-08 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 贺麟;杨霖;李丽琴;肖智宽 | 申请(专利权)人 | 四川汇源吉迅数码科技有限公司 |
代理机构 | 成都九鼎天元知识产权代理有限公司 | 代理人 | 四川汇源吉迅数码科技有限公司 |
地址 | 610031 四川省成都市青羊区外南人民路131号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于垂直搜索引擎的数字内容查询系统,该系统包括主节点服务器和多个从节点服务器,主节点服务器包括管理器和查询器,从节点服务器包括爬行器和索引器;管理器用于分割待爬行的网页的网页链接得到多个网页子链接,并将网页子链接分配给多个从节点服务器;爬行器用于按照分割的网页子链接抓取网页文本数据,并将网页子链接和网页文本数据绑定后保存到网页数据库中:索引器用于对网页数据库中的网页数据进行分词,并按照分词执行全文索引得到索引结果;查询器用于解析用户的查询请求得到查询关键词和查询条件,根据查询关键词和查询条件生成查询任务,并执行查询任务获得查询结果。本发明能够大幅提高用户的查询性能。 |
