Jun, 2024

了解您的邻里:由通话图查找驱动的一般性和零射能力的二进制函数搜索

TL;DR提出了一种基于图神经网络的二进制代码相似性检测方法,采用了一种新颖的图数据表示方法 —— 调用图集,通过一系列统计特征来编码二进制可执行文件中每个函数周围的邻域,从而捕捉局部和全局上下文。设计了专门的图神经网络模型,学习将图表示映射为编码了语义代码相似性的特征向量。实验结果表明,与基准技术相比,调用图集和新颖的图神经网络架构的结合在跨架构、单架构和零样本任务上取得了最先进的性能。此外,该方法在针对域外函数内联任务进行评估时也表现出色。总体而言,该研究提供了一种通用且有效的基于图神经网络的二进制代码相似性检测解决方案。