Oct, 2023

使用强化学习的语言智能体在狼人杀游戏中进行战略性对战

TL;DR基于强化学习的大语言模型(LLMs)和策略性语言智能体,通过使用 LLM 推理潜在欺诈行为和生成策略多样化动作的候选集,结合强化学习策略进行决策训练,取得了多样的突现策略,战胜其他 LLM 智能体并对抗人类对手在狼人游戏中保持强大。