一种基于ipfs的相似文件检索方法、电子设备及存储介质

基本信息

申请号 CN202111152397.2 申请日 -
公开(公告)号 CN113868195A 公开(公告)日 2021-12-31
申请公布号 CN113868195A 申请公布日 2021-12-31
分类号 G06F16/14(2019.01)I;G06F16/16(2019.01)I;G06F16/182(2019.01)I;G06F40/194(2020.01)I;G06F40/216(2020.01)I 分类 计算;推算;计数;
发明人 刘岭峰;毛岱山;肖苗苗;曾佑诚;柯亚萍;林宝泉;苏林麒;王超博;麦佩雨;王洪龙;陈意斌 申请(专利权)人 熵链科技(福建)有限公司
代理机构 厦门仕诚联合知识产权代理事务所(普通合伙) 代理人 程劲竹
地址 350000福建省福州市高新区乌龙江中大道7#创新园二期21号楼7层702室
法律状态 -

摘要

摘要 本发明提供了一种基于ipfs的相似文件检索方法、电子设备及存储介质。一种基于ipfs的相似文件检索方法,包括以下步骤:步骤一,将文件进行分割成块,并形成若干dag结构,dag结构的重复度等价于文件的重复度;步骤二,对每一dag结构的links中的hash进行再压缩后拼接成复合hash,将dag结构的重复度等价于复合hash的重复度;步骤三,维护复合hash和cid的映射关系;步骤四,在搜索引擎中维护复合hash;步骤五,在搜索引擎中搜索一特定的复合hash,得到与该复合hash重复度高的其他复合hash,通过步骤三维护的映射关系,找到文件在ipfs中的cid,进而查找到相似文件。本发明将文件的重复度转化为复合hash的重复度,并利用搜索引擎管理复合hash,ipfs系统管理文件。