一种基于分布式数据库的全文搜索引擎
基本信息
申请号 | CN201710395591.0 | 申请日 | - |
公开(公告)号 | CN107229714B | 公开(公告)日 | 2020-02-14 |
申请公布号 | CN107229714B | 申请公布日 | 2020-02-14 |
分类号 | G06F16/93;G06F16/27 | 分类 | 计算;推算;计数; |
发明人 | 江和慧;黄显洛 | 申请(专利权)人 | 杭州宇为科技有限公司 |
代理机构 | 浙江翔隆专利事务所(普通合伙) | 代理人 | 郭关夫 |
地址 | 310026 浙江省杭州市滨江区长河街道长河路475号1幢13层1325室 | ||
法律状态 | - |
摘要
摘要 | 本发明提出一种基于分布式数据库的全文搜索引擎,包括索引和搜索,其中:索引是将文档和文档经过分词后的单词存入分布式数据库;搜索是根据用户的输入,返回包含用户输入以及经过排序的结果。本发明使用三张表(即单词表、文档表和语料库表),采用不同的均衡字段,单词表用单词id分表,文档表用文档id分表,语料库表用单词id分表,从而在查询的时候,按照单词进行查询,单词表按照单词id作为均衡字段,只需要到指定的某些节点上执行即可,其搜索效率大大地提高。使用了分布式数据库作为存储介质,可以利用其强大的缓存和sql计算功能,另外分布式数据库自身带有分布式功能,使其具有很强的扩展能力。 |
