BriefGPT.xyz
Ask
alpha
关键词
zero-shot language grounding
搜索结果 - 1
CLIP-Nav: 使用 CLIP 进行零样本视觉与语言导航
本研究主要探讨利用 CLIP 模型在零样本情况下,通过描述目标对象的自然语言参考表达式来解决零样本视觉语言导航问题,并在 REVERIE 数据集上比较 CLIP 模型和监督学习模型的性能。结果显示,采用 CLIP 零样本方法的导航能力优于基
→
PDF
2 years ago
Prev
Next