Mar, 2024

基于上下文聚合的情境道德价值调整

TL;DR我们提出了一种基于上下文的道德价值对齐系统,通过对用户输入提取的特征,将适合回应用户的一部分最佳 LLM 响应整合在一起,该系统在与人类价值对齐方面显示出比现有技术更好的结果。