Dec, 2023

二进制代码摘要:ChatGPT/GPT-4 与其他大型语言模型对比评估

TL;DR本研究探讨了大型语言模型 (LLMs) 在二进制代码理解中的潜力,通过引入一个包含超过 557K 个二进制函数的全面基准和数据集 BinSum,以及一种新的提示综合和优化方法,并提出了一种新的语义相似度度量方法,对 ChatGPT、GPT-4、Llama 2 和 Code Llama 等知名 LLMs 进行了广泛评估,得出了 10 个关键见解,强调了 LLMs 在该领域的变革潜力以及尚待克服的挑战。