EMNLPNov, 2023

大型语言模型中用于阿瓦隆游戏中的角色识别的长时对话理解

TL;DR利用社交推理游戏 Avalon: The Resistance 中的欺骗行为和多方对话测试大型语言模型(LLMs)的能力和性能。