BriefGPT.xyz
大模型
Ask
alpha
关键词
zero-shot 3d classification
搜索结果 - 2
ViT-Lens: 走向全模态表示
本文介绍了一种名为 ViT-Lens 的方法,通过使用预训练的 ViT 模型感知新颖形式的多模态数据,并与预定义空间进行对齐,从而实现高效的全模态表示学习。在以 3D 为例的验证中,ViT-Lens 在零样本 3D 分类任务中取得了显著的改
→
PDF
10 months ago
MM
超越第一印象:整合多模态联合线索用于全面的 3D 表示
通过引入多视图联合模态建模方法,该研究论文提出了一种名为 JM3D 的新方法,以解决 3D 表示学习中的信息降解和不足协同问题,并在零样本 3D 分类任务上取得了领先于现有方法的性能。
PDF
a year ago
Prev
Next