二进制可执行文件同源分析方法、计算机设备及存储介质
基本信息
申请号 | CN202210434518.0 | 申请日 | - |
公开(公告)号 | CN114528015A | 公开(公告)日 | 2022-05-24 |
申请公布号 | CN114528015A | 申请公布日 | 2022-05-24 |
分类号 | G06F8/75(2018.01)I;G06F8/53(2018.01)I;G06F40/194(2020.01)I;G06F40/30(2020.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 吴潇;杨智霖;鲁俊 | 申请(专利权)人 | 湖南泛联新安信息科技有限公司 |
代理机构 | 长沙市护航专利代理事务所(特殊普通合伙) | 代理人 | - |
地址 | 410005湖南省长沙市开福区伍家岭街道栖凤路486号凯乐微谷商务中心1栋1710、1711房 | ||
法律状态 | - |
摘要
摘要 | 本发明具体公开了一种二进制可执行文件同源分析方法、计算机设备及存储介质,所述方法包括:生成二进制可执行文件对应的函数控制流图;在高维向量空间中生成对应的指令向量和基本块向量;基于预设神经网络模型获取同维度的函数向量矩阵;将函数向量矩阵进行矩阵相乘后并按照从大到小进行排序,进而获取相似函数对,利用相似函数对进行查找即可得到匹配结果。本发明将自然语言处理的双向多层转换编码器应用到汇编代码语言的语义生成上,通过在同维度的高维向量空间中生成对应的指令向量和基本块向量,并将函数控制流图与基本块向量结合得到对应的函数语义向量,基于相似函数对查找实现同源分析,具有鲁棒性强、运行速度快和测试效果好的特点。 |
