一种面向绿色云计算的重复数据删除方法及系统

基本信息

申请号 CN201810271309.2 申请日 -
公开(公告)号 CN108415671B 公开(公告)日 2021-04-27
申请公布号 CN108415671B 申请公布日 2021-04-27
分类号 G06F3/06 分类 计算;推算;计数;
发明人 徐小龙;王泊;牟亦奇;朱洁;王俊昌;刘茜萍;张洁;胥备 申请(专利权)人 上交所技术有限责任公司
代理机构 上海三方专利事务所(普通合伙) 代理人 吴玮;李美立
地址 200131 上海市浦东新区中国(上海)自由贸易试验区台中北路8号
法律状态 -

摘要

摘要 本发明涉及云计算和数据处理方法及系统技术领域,具体来说是一种面向绿色云计算的重复数据删除方法及系统,将文件划分为若干个数据块,并采用至少两个Hash函数分别对文件中的每个数据块进行指纹提取,将得到的每个数据块的至少两个指纹值作为数据块的唯一指纹,并将每个数据块的唯一指纹相结合作为文件的指纹序列,并对文件进行Hash运算,得到文件的指纹值,将文件的指纹序列和文件的指纹值相结合作为所述文件的唯一指纹。本发明同现有技术相比其优点在于对重复数据进行删除,降低了云环境中数据的冗余性,且解决了文件指纹之间的重复冲突问题,重复数据删除速度快,占用存储空间小,有效减低云环境的存储、电力资源开销,有助于系统实现绿色云计算。