May, 2019

行动组合:针对文本游戏中组合行动空间的稀疏模仿学习

TL;DR本研究提出了一个计算效率高的算法,结合压缩感知和模仿学习,用来解决具有组合动作空间的基于文本的游戏。研究表明,将新的压缩感知算法IK-OMP结合到监督式模仿学习中,所得到的稀疏模仿学习算法(Sparse-IL),无论是在完美演示还是嘈杂环境中的不完美演示下,都能解决包含大约1000万个动作的Zork1基于文本的游戏。