Sep, 2023

大型语言模型的战略行为:游戏结构 vs 上下文框架

TL;DR通过四个典型的双人博弈游戏,研究了 GPT-3.5、GPT-4 和 LLaMa-2 这三种大型语言模型在战略决策能力方面,同时考察了上下文框架对模型决策的影响,结果发现 LLM 在战略决策方面存在限制和熟练程度差异,不宜在需要复杂战略推理的任务中不加区分地使用。