ICCVAug, 2015

使用在合成 RGB-D 上训练的深度网络实现语义姿态

TL;DR通过深度卷积神经网络实现室内场景理解的任务。为了克服 RGB-D 训练数据不足的问题,采用实时渲染技术生成合成室内场景,并通过迁移学习的方式使得模型能够处理具有高度挑战性的真实场景。该神经网络具备较短的运行时间,可同时估计类别、姿态和位置等参数。