Apr, 2025
CLASH:从多角度评估语言模型在高风险困境中的判断能力
CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from
Multiple Perspectives
TL;DR本研究解决了在高风险困境中,现有研究对语言模型推理能力评估所存在的局限,尤其是在处理复杂的价值冲突时。我们引入了CLASH数据集,采用多样化的角色视角,揭示了语言模型在判断模糊决策和理解价值转变方面的不足,强调了针对复杂价值进行推理的必要性。研究发现,强大的语言模型在复杂情境中的准确率不到50%,明确表明了需改进这一领域的潜力。