Apr, 2024

AIGeN:视觉定位导航中的指令生成的对抗性方法

TL;DR通过使用生成对抗网络(GANs)的启示,提出了AIGeN,一种新颖的架构,用于生成有意义且形式良好的合成指令,从而改善导航代理的性能,该模型由Transformer解码器(GPT-2)和Transformer编码器(BERT)组成。经过实验证明,使用AIGeN在Habitat-Matterport 3D Dataset(HM3D)上对217K条路径生成合成指令可以改善现成的VLN方法的性能,其验证分析表明该提案的前景非常有希望,达到了最先进的性能水平。