Dec, 2023

LiDAR-LLM:探索大语言模型在3D LiDAR理解方面的潜力

TL;DRLiDAR-LLM使用Large Language Models(LLMs)和Multimodal Large Language Models(MLLMs)来理解3D场景,通过重新构建3D场景认知为语言建模问题并使用View-Aware Transformer(VAT)来加强LLMs的空间定向理解,从而实现对3D场景的多种指令的理解和复杂空间推理。