Apr, 2024

Any2Point:强化各模态大型模型以实现高效的三维理解

TL;DRAny2Point 是一种参数高效的方法,通过引入虚拟投影策略和引导适配器模块,使得基于任何模态(视觉、语言、音频)的大型模型能够进行 3D 理解,并且在实验中展示了方法的有效性和高效性。