MMOct, 2021

基于神经符号方法的交互指令跟随模型的物体和指令变化鲁棒性改进

TL;DR通过提出神经符号化方法,将高级符号特征用作中间表征,来解决自然语言指令和第一视角视觉映射到与 3D 环境中对象进行交互的操作序列时神经网络特征提取对小的改变过于敏感而未能适应测试集中未见过的属性和指令的问题。在 ALFRED 基准测试的子任务评估中,我们的实验结果表明,和端到端的神经模型相比,我们的方法在切换对象、拿起对象和切片对象的成功率等未知环境下的交互任务中显着优于前者 9 点,46 点和 74 点。