适用于分布式文件系统的文件随机写方法及系统

基本信息

申请号 CN201910973982.5 申请日 -
公开(公告)号 CN110795407B 公开(公告)日 2022-06-10
申请公布号 CN110795407B 申请公布日 2022-06-10
分类号 G06F16/172(2019.01)I;G06F16/182(2019.01)I 分类 计算;推算;计数;
发明人 沈晨;杜真真;王敬平;黄子君;徐文远;周洁;褚少鹤 申请(专利权)人 华东计算技术研究所(中国电子科技集团公司第三十二研究所)
代理机构 上海段和段律师事务所 代理人 -
地址 201800上海市嘉定区嘉罗路1485号
法律状态 -

摘要

摘要 本发明提供了一种适用于分布式文件系统的文件随机写方法及系统,包括:步骤1:将HDFS的写接口更新成支持随机写模式,使随机写操作仅影响直接修改的块或者有限的相邻块;步骤2:扩展HDFS数据传输协议,使客户端可访问任意的数据分块;步骤3:更新服务端数据包处理、更新校验值计算,获取数据副本更新、校验值更新。本发明中,存储于分布式文件系统的文件在更新数据内容时,只会影响当前数据分块及相邻的数据分块,而不会像原生HDFS需将整个文件写回,造成大量不必要的数据传输,本发明有效的减少了数据传输和移动,缓解网络带宽压力,降低客户端和服务端的处理资源消耗。