Oct, 2022

基于 Transformer 的大规模预训练体验对话本地化

TL;DR本研究提出了一种基于 LED-Bert 结构的 Localization via Embodied Dialog 方法,使用基于图的场景表示来预测观察者在地图上的最终位置,实验结果表明该方法优于之前的基准方法。