Mar, 2024

面向视觉与语言导航的时空物体关系建模

TL;DR利用交叉注意机制, 通过对象关系提高代理导航能力, 并引入回转惩罚损失函数以解决代理的重复位置访问问题。