Nov, 2024

大规模道德机器实验在大型语言模型中的应用

TL;DR该研究针对大型语言模型在自动驾驶系统中的道德决策能力进行评估,填补了过往研究对模型道德判断的理解差距。通过分析51种不同的语言模型,本研究发现,超过100亿参数的模型在道德判断上与人类偏好较为一致,但模型更新未必能提升这一一致性,强调在设计自动化系统时需权衡判断质量与计算效率。