ICCVAug, 2017

通过表示扭曲的方法实现语义视频卷积神经网络

TL;DR本文提出了一种将用于静态图像的 CNN 模型转换为用于视频数据的 CNN 模型的技术,利用名为 NetWarp 的模块,通过邻帧的光流在时间上进行网络表示的扭曲,同时将光流方法与不同的 CNN 架构结合以实现改进,最终在 CamVid 和 Cityscapes 数据集上实现了最新的最佳效果。