BriefGPT.xyz
Jan, 2025
分析六个大型语言模型的伦理逻辑
Analyzing the Ethical Logic of Six Large Language Models
HTML
PDF
W. Russell Neuman, Chad Coleman, Manan Shah
TL;DR
本研究探讨了六个主要生成性大型语言模型的伦理推理,尤其是在道德困境(如电车难题和海因茨难题)中的表现。研究采用可解释性和透明性框架,要求模型解释其伦理推理,发现这些模型在伦理逻辑上表现出显著的一致性,主要强调理性和结果导向,尽管在微调和后训练过程中的伦理推理存在微妙但重要的差异。
Abstract
This study examines the
Ethical reasoning
of six prominent generative
Large language models
: OpenAI GPT-4o, Meta LLaMA 3.1, Perplexity, Anthropic Claude 3.5 Sonnet, Google Gemini, and Mistral 7B. The research exp
→