BriefGPT.xyz
Ask
alpha
关键词
visual-and-language navigation
搜索结果 - 2
CVPR
GeoVLN:使用槽注意力学习几何增强的视觉表征,用于视觉语言导航
GeoVLN 提出了一种几何加强的视觉表示学习方法,基于 Slot Attention 技术和 V&L BERT 模型结合自然语言和多种视觉输入信息实现了强大的视觉和语言导航功能,取得了很好的实验效果。
PDF
a year ago
层次化跨模态机器人视觉语言导航智能体
该研究论文提出了一种基于连续三维重建环境的机器人视觉和语言导航(Robo-VLN)的设定,并利用分层决策,模块化训练和分离推理和模仿的策略,成功地解决了 Robo-VLN 这一新任务。通过使用 HCM 代理,研究者展示了比现有基线效果更好的
→
PDF
3 years ago
Prev
Next