Apr, 2025
警示!将现成的大型语言模型应用于编程任务的危害
Code Red! On the Harmfulness of Applying Off-the-shelf Large Language
Models to Programming Tasks
TL;DR本研究针对当前开发者依赖大型语言模型(LLM)进行编码任务的现状,提出了一种评估LLM在软件工程领域潜在危害的框架。研究发现,不同LLM在无害性对齐方面存在显著差异,并指出一些特定模型的设计选择可能导致产生有害内容,而较大的模型则表现得更加有用。这一发现为软件工程任务的对齐策略提供了有价值的见解。