Apr, 2024

大众的领袖?评估大型语言模型在狼人游戏中的舆论领导力

TL;DR基于狼人游戏的模拟平台,评估大型语言模型的本领领导力,并开发了两个新的度量标准,分别衡量意见领袖的可信度和对他人决策的影响力。结果表明,狼人游戏适合评估大型语言模型的意见领袖能力。