Nov, 2022
通过微调语言模型,在人类具有不同偏好的情况下寻找共识
Fine-tuning language models to find agreement among humans with diverse
preferences
Michiel A. Bakker, Martin J. Chadwick, Hannah R. Sheahan, Michael Henry Tessler, Lucy Campbell-Gillingham...
TL;DR通过 fine-tuning 机制,使用大型语言模型生成众人认可的共识性议论,以协调多样化的人类意见,并发现从子集中生成的共识性声明提高了个体贡献,并能够被人类用户所接受,具有较强的差异性和普适性。