Oct, 2019

基于三维视觉特征表示的具身化语言基础

TL;DR提出结合语言表述和三维可视化的方法,通过生成模型和检测模型等工具,可以从图像中推理出三维可视特征图,并进一步实现语言方面的任务,如检测引用表达和物体放置策略。这种方法可以更好地进行全景视角和空间推理。