BriefGPT.xyz
Ask
alpha
关键词
2d vision-language models
搜索结果 - 2
3D 特征蒸馏与对象为中心先验
将自然语言与物理世界联系起来是一个应用广泛的话题,该论文提出了一种基于对象中心先验知识的多视角特征融合策略,用于改善基于 2D 和 3D 图像的自然语言 grounding 和语言引导机器人抓取任务。
PDF
10 days ago
基于几何驱动的零样本三维点云理解聚合
通过利用点云的几何结构改进传输的视觉 - 语言模型,我们提出了首个无需训练的聚合技术,通过几何和语义的点级推理,在分类、部件分割和语义分割等三个任务中取得了新的技术优势。
PDF
7 months ago
Prev
Next