一种基于分布式数据库的全文搜索引擎

基本信息

申请号 CN201710395591.0 申请日 -
公开(公告)号 CN107229714B 公开(公告)日 2020-02-14
申请公布号 CN107229714B 申请公布日 2020-02-14
分类号 G06F16/93;G06F16/27 分类 计算;推算;计数;
发明人 江和慧;黄显洛 申请(专利权)人 杭州宇为科技有限公司
代理机构 浙江翔隆专利事务所(普通合伙) 代理人 郭关夫
地址 310026 浙江省杭州市滨江区长河街道长河路475号1幢13层1325室
法律状态 -

摘要

摘要 本发明提出一种基于分布式数据库的全文搜索引擎,包括索引和搜索,其中:索引是将文档和文档经过分词后的单词存入分布式数据库;搜索是根据用户的输入,返回包含用户输入以及经过排序的结果。本发明使用三张表(即单词表、文档表和语料库表),采用不同的均衡字段,单词表用单词id分表,文档表用文档id分表,语料库表用单词id分表,从而在查询的时候,按照单词进行查询,单词表按照单词id作为均衡字段,只需要到指定的某些节点上执行即可,其搜索效率大大地提高。使用了分布式数据库作为存储介质,可以利用其强大的缓存和sql计算功能,另外分布式数据库自身带有分布式功能,使其具有很强的扩展能力。