Apr, 2024

训练神经网络解释二进制

TL;DR在这项工作中,我们开始探讨使用深度神经网络对二进制代码理解进行训练的可能性。具体而言,网络将以直接从二进制中派生的特征作为输入,并输出英文功能描述,以帮助逆向工程师调查闭源软件的功能,无论是恶意的还是良性的。我们发现嵌入距离相关性(EDC)测试对于评估数据集值非常有诊断能力,表明我们收集的数据集和一些现有的开源数据集质量较低。