CVPRDec, 2016

视觉编译器:合成场景特定行人检测器和姿势估计器

TL;DR使用 Visual Compiler 概念生成特定场景下的人行检测器和姿态估计器,通过计算机图形渲染预测场景中人体的几何和光度精确图像,再使用生成的图像训练出一个空间可变的卷积神经网络,从而在缺乏真实人体标注数据时提供一种非常优秀的快速检测和姿态估计的解决方案。