BriefGPT.xyz
大模型
Ask
alpha
关键词
3d-visual-language model
搜索结果 - 1
Scene-LLM: 扩展语言模型用于 3D 视觉理解和推理
介绍了 Scene-LLM,一种增强 3D 室内环境中具有交互能力的具身化智能体的 3D 视觉语言模型,通过整合大型语言模型(LLM)的推理能力。该模型采用混合的 3D 视觉特征表示方法,结合了密集的空间信息并支持场景状态更新。它采用投影层
→
PDF
4 months ago
Prev
Next