Nov, 2023

价值基点:将大型语言模型映射到基本人类价值的多维谱系

TL;DR本研究提出了一种基本价值对准范式,并在基本价值维度上构建了一个价值空间,通过识别潜在价值将所有大型语言模型的行为映射到该空间,以解决对其负有责任的发展中的三个挑战。