源代码文件克隆邻接表合并检测方法
基本信息
申请号 | CN201710140323.4 | 申请日 | - |
公开(公告)号 | CN107066262A | 公开(公告)日 | 2017-08-18 |
申请公布号 | CN107066262A | 申请公布日 | 2017-08-18 |
分类号 | G06F9/44(2006.01)I;G06F11/36(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 罗峋;饶飞 | 申请(专利权)人 | 苏州棱镜七彩信息科技有限公司 |
代理机构 | 苏州唯亚智冠知识产权代理有限公司 | 代理人 | 苏州棱镜七彩信息科技有限公司 |
地址 | 215000 江苏省苏州市苏州工业园区苏州大道东381号商旅大厦6幢902室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种源代码文件克隆邻接表合并检测方法,对工程项目文件以文件为单位,对代码每行以固定行数进行扫描为粒度,用MD5构造指纹Chunk并建立指纹库。指纹库保存在MySQL数据库中,以指纹所在的开源项目id和Chunk的Hash值作为索引进行检测算法,能实现克隆0到3类检测。即:提出基于分布式索引的源代码文件克隆邻接表合并检测方案及算法。该检测算法的检测实现能在时间复杂度为O(nm),空间复杂度为O(nm)内检测出克隆的代码文件,实现海量检测。 |
