一种基于频繁项集挖掘的沙箱知识库生成方法和装置
基本信息
申请号 | CN202011535297.3 | 申请日 | - |
公开(公告)号 | CN112257062B | 公开(公告)日 | 2021-04-16 |
申请公布号 | CN112257062B | 申请公布日 | 2021-04-16 |
分类号 | G06F21/53(2013.01)I;G06F21/56(2013.01)I | 分类 | 计算;推算;计数; |
发明人 | 曲武 | 申请(专利权)人 | 北京金睛云华科技有限公司 |
代理机构 | 沈阳友和欣知识产权代理事务所(普通合伙) | 代理人 | 杨群;郭悦 |
地址 | 100088北京市海淀区北三环中路44号58号1层21号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于频繁项集挖掘的沙箱知识库生成方法和装置,方法包括:获取样本数据集并进行标注;利用沙箱对样本的主机行为和网络行为进行监控,利用样本指令嵌入算法对样本行为文件进行预处理并生成样本指令片段嵌入集合;利用多种算法获取样本家族的关联规则集合;对样本家族的关联规则集合进行分解,过滤样本合法的频繁行为模式,对剩下的频繁行为模式进行恶意样本家族标注,通过嵌入向量映射获取可读的恶意行为模式描述,生成恶意样本沙箱的行为知识库。本发明可以大规模分析样本的行为数据,提高了沙箱行为知识库的质量和生成效率,允许沙箱自动识别具有类似行为的新型恶意样本,有效检测采用混淆和其他多态变形技术的APT样本。 |
