Jul, 2022

语义抽象:从 2D 视觉语言模型实现开放式三维场景理解

TL;DR本文介绍了一种基于视觉语言模型的语义抽象框架,可以为机器人在未结构化的三维环境中推理,并学会三维空间和几何推理技能,并在两个开放式三维场景理解任务上进行了实验测试。