ACLOct, 2020

如何激励你的巨龙:教授目标驱动型智能体在奇幻世界中说话和行动

TL;DR使用大规模语言建模和常识推理的预训练来提高多代理之间的沟通,使用 RL 系统平衡行动和对话并结合人工操作进行零样本评估。