Mar, 2025
PiSA:一种自增强的数据引擎和大型模型的训练策略用于三维理解
PiSA: A Self-Augmented Data Engine and Training Strategy for 3D
Understanding with Large Models
TL;DR本研究解决了三维多模态大语言模型(MLLMs)在数量和质量上存在的不足。提出的PiSA-Engine框架通过生成具有三维空间语义的指令点语言数据集,创新性地结合了2D和3D模型的优势,从而实现高质量数据的持续生成。实验结果显示,PointLLM-PiSA在我们的PiSA-Bench基准上在零-shot三维物体描述和生成分类中提供了显著的性能提升。