一种基于Jaccard系数的恶意样本相似性判定方法

基本信息

申请号 CN202110711130.6 申请日 -
公开(公告)号 CN113378165A 公开(公告)日 2021-09-10
申请公布号 CN113378165A 申请公布日 2021-09-10
分类号 G06F21/56(2013.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 任传伦;刘文瀚;吕帅;夏建民;张先国;刘晓影;王淮;俞赛赛;乌吉斯古愣;孟祥頔 申请(专利权)人 中电科网络空间安全研究院有限公司
代理机构 北京丰浩知识产权代理事务所(普通合伙) 代理人 李学康
地址 100083北京市海淀区北四环中路211号
法律状态 -

摘要

摘要 本发明公开了一种基于Jaccard系数的恶意样本相似性判定方法,其具体包括:利用String命令对恶意样本Ⅰ和恶意样本Ⅱ分别进行解析并提取恶意样本字符串,将提取到的恶意样本字符串分别转化为样本字符串集合A和B;计算出样本字符串集合A和B之间的Jaccard系数;设定一个阈值,若计算得到的Jaccard系数值大于阈值,则判定恶意样本Ⅰ和恶意样本Ⅱ之间具有较强的相似性;对于具有较强的相似性的恶意样本Ⅰ和恶意样本Ⅱ,利用空间谱函数,找到恶意样本所在的字符串。本发明提供了一种新型的恶意样本相似性判定方法,无需进行恶意样本特征提取等复杂操作,可以提高恶意样本相似性判定的效率。