两阶段布谷鸟过滤器及基于两阶段布谷鸟过滤器的重复数据删除方法

基本信息

申请号 CN202110885281.3 申请日 -
公开(公告)号 CN113535706A 公开(公告)日 2021-10-22
申请公布号 CN113535706A 申请公布日 2021-10-22
分类号 G06F16/215;G06F16/22;G06F16/2455 分类 计算;推算;计数;
发明人 李挥;刘涛;王博辉;崔凯;蒋傅礼;张华宇 申请(专利权)人 佛山赛思禅科技有限公司
代理机构 深圳市锟剑恒富知识产权代理有限公司 代理人 温玉珍
地址 400000 重庆市南岸区经开区长生桥镇江峡路1号10幢
法律状态 -

摘要

摘要 本发明适用于数据处理技术改进领域,提供了一种两阶段布谷鸟过滤器,两阶段布谷鸟过滤器,其特征在于,所述两阶段布谷鸟过滤器由若干个桶组成,每个桶由若干个单元组成,每个单元可被用于存放数据指纹,若干个单元构成二维指纹矩阵的结构,每个待插入的元素和两个哈希函数相关联,同时将插入算法按照负载率划分为两个阶段,使用在负载率较低的第一阶段主动进行重定位的策略缓解了数据负载不均的问题,有效的降低了布谷鸟过滤器的插入时延,从而增加了重复数据删除系统的效率和吞吐量。