Oct, 2024
语言模型能否推理个体化的人类价值观和偏好?
Can Language Models Reason about Individualistic Human Values and
Preferences?
TL;DR本研究解决了AI系统在处理多样性需求时常见的对个体差异平滑化和刻板化的问题。通过引入IndieValueCatalog数据集,研究了语言模型在个体化价值推理中的局限性,发现其准确率仅为55%到65%。该研究表明,仅通过人口统计信息无法准确描述个体价值,同时提出了IndieValueReasoner以增强模型的个体价值推理能力。