Jul, 2019

数据高效的神经指令跟随预学习环境表示

TL;DR研究了一种自然语言指令到状态转换(动作)映射的数据有效学习方法,该方法受到从先前的语言观察中形成的概念容易被关联到语言的思想的启发。通过使用观察自由语言状态转换的初始环境学习阶段来增强基线指令跟随学习器,使其在处理指令跟随训练数据之前诱导出适当的动作潜在表示。该研究表明,相比仅从有限的教学数据中学习表示,映射到预先学习的表示显著提高了性能。