Apr, 2024

PEVA-Net: 针对零/少样本多视角三维形状识别的提示增强的视图聚合网络

TL;DR基于多视图表征,利用大型视觉语言模型CLIP,探索零/少样本三维形状识别任务,并提出Prompt-Enhanced View Aggregation Network (PEVA-Net)以同时解决零/少样本场景下的三维形状识别问题,通过自我蒸馏方案显著提高了少样本学习效果。