Mar, 2025

从图像和文本进行多模态3D网格重建

TL;DR本研究针对传统依赖大数据集和高计算成本的6D物体姿态估计问题,提出了一种语言引导的少样本3D重建方法。通过处理少量输入图像和语言查询,该方法实现了3D网格的高质量重建,显著提高了重建的准确性和效率。