BriefGPT.xyz
Ask
alpha
关键词
natural linguistic descriptions
搜索结果 - 1
WildRefer: 基于多模态视觉数据和自然语言的大规模动态场景中的 3D 物体定位
本研究提出了一种基于自然语言描述和多模式视觉数据的大规模动态场景的 3D 视觉定位任务的方法,并且通过利用图像的外观特征、点云中的位置和几何特征以及连续输入帧中的动态特征,匹配语言中的语义特征。我们提出了两个新的数据集,STRefer 和
→
PDF
a year ago
Prev
Next