ACLOct, 2020
如何激励你的巨龙:教授目标驱动型智能体在奇幻世界中说话和行动
How to Motivate Your Dragon: Teaching Goal-Driven Agents to Speak and Act in Fantasy Worlds
Prithviraj Ammanabrolu, Jack Urbanek, Margaret Li, Arthur Szlam, Tim Rocktäschel...
TL;DR使用大规模语言建模和常识推理的预训练来提高多代理之间的沟通,使用 RL 系统平衡行动和对话并结合人工操作进行零样本评估。