Feb, 2025

VITAL: 一个用于医疗领域多元对齐基准的新数据集

TL;DR本研究针对现有对齐技术未能充分考虑医疗领域中多样化观点这一问题,提出了一个新数据集VITAL,包含13100个价值导向的情境和5400个多选题,专注于健康领域的多元对齐评估。研究发现,现有的多元对齐技术在满足不同医疗信仰方面的有效性不足,突显了在特定领域发展量身定制的人工智能对齐的必要性。