BriefGPT.xyz
Nov, 2024
大规模道德机器实验在大型语言模型中的应用
Large-scale moral machine experiment on large language models
HTML
PDF
Muhammad Shahrul Zaim bin Ahmad, Kazuhiro Takemoto
TL;DR
该研究针对大型语言模型在自动驾驶系统中的道德决策能力进行评估,填补了过往研究对模型道德判断的理解差距。通过分析51种不同的语言模型,本研究发现,超过100亿参数的模型在道德判断上与人类偏好较为一致,但模型更新未必能提升这一一致性,强调在设计自动化系统时需权衡判断质量与计算效率。
Abstract
The rapid advancement of
Large Language Models
(LLMs) and their potential integration into
Autonomous driving
systems necessitates understanding their
→