Jan, 2024

知情人工智能监管:通过伦理审核比较领先的 LLM 聊天机器人的伦理框架,评估道德推理和规范价值

TL;DR通过进行基于伦理的审计,该研究评估了 8 个主要的商业和开源大型语言模型(包括 GPT-4)的可解释性和可信度,比较不同模型在道德推理和伦理框架上的规范价值,以探索人工智能与人类的伦理对齐问题。研究结果表明,GPT-4 表现出了一个复杂的伦理框架,但同时也显示出对特定文化规范存在明显偏见的规范框架和令人不安的威权主义倾向。