Feb, 2022

利用语言抽象提高内在探索能力

TL;DR本文研究探讨使用自然语言作为一种通用媒介以提高强化学习领域中稀疏奖励的训练效果,通过与 AMIGo 和 NovelD 等竞争性内部探索基线进行直接扩展和比较,本研究探究语言能否优化现有的探索方法,其与非语言形式相比在 MiniGrid 和 MiniHack 环境套件的 13 项挑战任务中表现更好(提高了 47-85%)。