BriefGPT.xyz
Ask
alpha
关键词
navigation environments
搜索结果 - 2
AAAI
VLN-Video:利用行车视频进行户外视觉语言导航
提出了 VLN-Video 方法来改善室外视觉与语言导航的性能,利用驾驶视频中多个城市的多样化室外环境和自动生成的导航指令和行动,通过结合传统直觉方法和现代深度学习技术进行预训练和微调,实现了在 Touchdown 数据集上 2.1%的任务
→
PDF
5 months ago
结构编码辅助任务在视觉语言导航中改进视觉表示
通过结构编码辅助任务 (SEA) 预先训练视觉编码器,可以提高视觉和语言导航中绝对成功率,尤其是在测试环境中,这种预训练技术可以很好地编码场景的结构信息。
PDF
2 years ago
Prev
Next