Jun, 2018

大规模并行视频网络

TL;DR本文介绍了一类因果视频理解模型,旨在通过最大化吞吐量、最小化延迟和减少时钟周期的数量来提高视频处理的效率,利用操作流水线和多速率时钟的优势,每个时间步对每个帧执行最少量的计算 (例如仅四个卷积层),以产生输出,通过将这些操作以流水线的方式进行深度并行计算,应用于现有图像架构并分析在两个视频任务上的行为:动作识别和人体关键点定位。结果表明,在几乎不损失性能的情况下,可以实现显著的并行性和速度提升。