本文提出了一种利用未标记数据改进的视频语义分割训练模型,该模型结合了卷积架构和时空转换器循环层,并能够通过光流适应性地门控使时间上的标记信息传递,模型通过未标记帧来改善视频分割准确性,并在基于多个深度架构中进行了广泛实验。
Dec, 2016
本研究提出了一种视频语义分割框架,该框架利用特征传播模块和自适应调度器相结合的方法,通过时间间隔自适应地融合特征并根据准确性预测动态分配计算量,以实现低延迟和高语义分割质量。实验结果表明,在与现有模型的比较中,该模型在 Cityscapes 和 CamVid 这两个数据集上获得了竞争性的性能,并将延迟从 360 ms 降低到 119 ms。
Apr, 2018
本文提出了一种新的加速视频推理的方法 —— 使用基于块运动向量和特征传播技术实现的快速特征传播技术以及基于周围帧传播得到的特征的特征插值技术,能够在保持精度的前提下,将图像分割的速度从单帧基线的 30ms 提高到每秒 20 帧,实现了几乎 6 倍的改进。
Mar, 2018
本研究探讨了如何通过引入语义先验来指导外观模型,从而解决半监督视频对象分割的问题,并提出了半监督视频对象分割(SGV)方法,该方法能够在每帧半秒钟的时间内,在两个不同的数据集上使用各种评估指标,比以前的最新技术取得更好的结果。
Apr, 2017
本研究提出了一种名为 VideoGCRF 的方法,采用深度高斯条件随机场对密集连接的时空图进行精确和高效的推断,能够与现代深度网络一起进行端到端的视频理解训练,并在语义分割和实例分割的任务中呈现出实证上的优越性。
Jul, 2018
利用消失点先验知识的 VPSeg 模型在驾驶场景下进行视频语义分割,通过两个模块(DenseVP 和 MotionVP)利用静态和动态消失点先验知识,实现了更加有效的分割结果。这种模型在两个流行的驾驶分割基准数据集 Cityscapes 和 ACDC 上的实验证明了其在准确性方面的卓越表现,同时计算开销相对较小。
Jan, 2024
本文提出了一种高清视频实时语义分割的混合 GPU / CPU 方法,并给出了一种称之为 EVS 的管道,该管道结合了 CPU 和 GPU 两种不同的处理方式,以优化视频帧率和分割准确度。
Dec, 2019
本文提出了基于光流和边缘线索的新型显着性估计技术和新型邻域图,用于解决快速运动,运动模糊和遮挡等视频分割的挑战,在 DAVIS,SegTrack v2 和 FBMS-59 数据集中取得了超越深度学习方法的最新成果。
Sep, 2018
本文提出了一种基于全卷积神经网络和门控循环体系结构的循环全卷积网络,利用视频中的时间信息进行在线语义分割, 大幅提高了分割的准确性,可以在二进制和语义视频分割任务中应用。
Nov, 2016
本文提出了一种基于网格结构特征表示的新型单阶段框架,并引入协作操作模块来聚合可用帧的信息以丰富所有 VIS 子任务的特征,从而在所有 VIS 任务中高效地充分利用先前信息,实现了实时处理,并在 YouTube-VIS 2019 和 21 数据集上获得了新的最高准确率(38.6 AP 和 36.9 AP)和速度(40.0 FPS),代码已公开。
Dec, 2021