Nov, 2024

冗长不等于真实:揭示大型语言模型的冗长补偿行为

TL;DR本研究聚焦于大型语言模型(LLMs)中存在的冗长补偿行为(VC),这一行为在用户不确定时表现为生成多余的响应,影响用户理解效率及增加生成无用令牌的成本。通过对14个新开发的LLMs在五个数据集的实验,本文首次界定和分析VC,提出了一种简单有效的级联算法来缓解这一现象,从而显著降低了冗长响应的频率和模型的不确定性。