May, 2023

VL-Fields: 往语言为基础的神经内隐空间表征方向前进

TL;DR提出了一种名为 VL-Fields 的模型,它是一种神经隐式空间表示,通过将语言驱动的分割模型中的信息与场景几何和视觉语言训练的潜在特征编码和融合,实现了开放词汇语义查询,适用于机器人领域;在语义分割任务上,我们的模型优于类似的 CLIP-Fields 模型近 10%。