Jul, 2024

解码多语言道德偏好:通过道德机器实验揭示大型语言模型的偏见

TL;DR本研究解决了关于大型语言模型(LLMs)在不同文化和语言背景下的道德判断问题,填补了当前多语种道德偏见分析的空白。通过道德机器实验(MME),我们分析了五种大型语言模型在十种语言中的道德偏好,发现模型的道德偏见与人类偏好之间存在显著差异,尤其是Llama 3偏离人类价值观,表现出偏好较少拯救人数的倾向。