Oct, 2024

对抗性游戏中推理、记忆和微调语言模型的方法

TL;DR本研究解决了预训练语言模型在处理复杂不熟悉游戏时的局限性,提出了一种将思维树与多智能体框架相结合的方法。这种方法分解游戏解决过程为四个增量任务,并应用于对抗性游戏,展示了65%的胜率,相较于基准算法在微调后再提升了10%,强调了其高效性与可扩展性。