May, 2023

在模拟人类社会中训练基于社交对齐的语言模型

TL;DR提出一种新的 LMs 训练范式,让其可以从模拟社交互动中学习,从而使人工智能系统更好地符合社会规范和价值观。