BriefGPT.xyz
Ask
alpha
关键词
moral biases
搜索结果 - 2
大型语言模型的道德基础
本文通过使用道德基础理论分析研究已知的大型语言模型,发现它们存在特定的道德偏见,并展示了这些偏见与人类道德基础和政治倾向之间的关系。此外,研究还衡量了这些偏见的一致性,并证明了通过不同上下文的选择性引导可以影响模型在后续任务中的行为,从而揭
→
PDF
8 months ago
多语言使用对语言模型的道德偏见产生影响
本文探讨了预训练的多语言语言模型是否会从英语中捕捉道德规范,并将其强加在其他语言中,以及它们是否在某些语言中表现出随机且潜在有害的信念。研究还在多语言模型上应用了 MoralDirection 框架,分析了在过滤的平行字幕语料库上的模型行为
→
PDF
2 years ago
Prev
Next