Jan, 2022

从语言中学习不变语义表示,实现可扩展策略普适性

TL;DR该研究提出了一种新的方法 —— 元素随机化,通过一组具有随机元素的环境来从自然语言指令中提取任务相关的语义而不受环境影响,同时设计了一个层次化的策略,将子目标建议为语义不变的表示形式,可在长时间视角任务上表现出卓越的泛化性能并能够完成一次性任务。