一种实现Hbase二级索引的方法

基本信息

申请号 CN202010772018.9 申请日 -
公开(公告)号 CN111984756A 公开(公告)日 2020-11-24
申请公布号 CN111984756A 申请公布日 2020-11-24
分类号 G06F16/31(2019.01)I 分类 计算;推算;计数;
发明人 母延年;于昆鹏;陈雨;孙国良 申请(专利权)人 南京好鱼科技有限公司
代理机构 - 代理人 -
地址 210000江苏省南京市江宁区董村路39号2幢天琪科技大厦706室(江宁开发区)
法律状态 -

摘要

摘要 本发明涉及大数据查询处理技术领域,具体公开了一种实现Hbase二级索引的方法,包括如下步骤,S1:Hbase store中进行扩展,在原先存储结构的基础上扩展一层lucene索引,lucene索引与MemStore和StoreFile位于同一个进程内,不需要跨进程交互;S2:将lucene作为对Hfile的补充,与Hbase上层写入对接,写入Hfile或MemStore的同时也会将数据写入到lucene,且lucene索引也会随着store的逻辑进行合并或拆分操作;S3:lucene的存储与Hfile一样,基于HDFS存储,存储规则与HDFS相同,基于表名,列簇,regin分散在不同的HDFS目录上;S4:查询时,结合scan根据不同的查询,自动适配查询,原有的逻辑转发到lucene之上,借助lucene实现Hbase二级索引的功能;本发明补足了Hbase只能做KV查询的局限性,使得Hbase既有KV查询性能,又有lucene全文检索、多维筛选的特性。