Apr, 2024
PRISM对鲍尔语言模型的主观和多元文化对齐的参与式、代表性和个性化人类反馈
The PRISM Alignment Project: What Participatory, Representative and
Individualised Human Feedback Reveals About the Subjective and Multicultural
Alignment of Large Language Models
TL;DRPRISM是一项以人为导向的研究,通过调查1,500个来自75个国家具有不同社会经济背景和偏好的参与者与21个LLMs的8,011个实时对话,探讨人类反馈收集的方法、领域、人员和目标,并通过对话多样性、偏好多样性和福利结果等案例研究证明了PRISM的有用性,提倡更广泛的参与AI开发和更包容的技术设计。