Sep, 2022

面向室内移动代理的多模态多任务场景理解模型

TL;DR本文探讨了个性化移动智能体中的感知系统需要开发室内场景理解模型,该模型能够理解 3D 几何、捕捉客观性、分析人类行为等,并且描述了 MMISM(多模态输入多任务输出室内场景理解模型)来解决室内环境数据量不足以及杂乱信息融合等问题,并表明 MMISM 在 3D 目标检测结果上优于传统单一任务模型。