Jan, 2025

分析六个大型语言模型的伦理逻辑

TL;DR本研究探讨了六个主要生成性大型语言模型的伦理推理,尤其是在道德困境(如电车难题和海因茨难题)中的表现。研究采用可解释性和透明性框架,要求模型解释其伦理推理,发现这些模型在伦理逻辑上表现出显著的一致性,主要强调理性和结果导向,尽管在微调和后训练过程中的伦理推理存在微妙但重要的差异。