Sep, 2016

UberNet: 使用多样化数据集和有限内存训练 “通用” 的卷积神经网络,以进行低、中、高层次的视觉处理

TL;DR本文介绍了一种卷积神经网络,在统一体系结构中同时处理低阶,中阶和高阶视觉任务,其通过端到端训练,为视觉任务提供了通用解决方案,同时解决了训练深度架构时依赖不同训练集和训练多个任务时内存有限的问题,通过这些方法在单个 GPU 上每帧 0.7 秒地同时处理多项任务,其中包括边界检测,正常估计,显著性预测,语义分割,人体部分分割,语义边界检测,区域建议生成和物体检测等,同时保证了高准确率。