Jun, 2019

通过生成和遵循自然语言指令进行分层决策

TL;DR使用自然语言隐式指令作为复杂动作的表达和组合,而不是直接选择微操作,本文基于 76,000 个自然语言指令和操作的数据集在实时策略游戏环境中训练模型,结果表明使用自然语言作为潜变量的模型在动作表达中的有效性显著优于直接模仿人类动作的模型,并且语言的组合结构对其有效性具有关键作用。同时提供了代码、模型和数据。