Accel: 一种用于视频高效语义分割的校正融合网络

Jul, 2018

Accel: 一种用于视频高效语义分割的校正融合网络

Accel: A Corrective Fusion Network for Efficient Semantic Segmentation on Video

Samvit Jain, Xin Wang, Joseph Gonzalez

TL;DRAccel是一种新型的语义视频分割系统，通过结合两个网络分支的预测（即提取参考关键帧上的高细节特征并使用帧到帧光流估计前向变形这些特征的参考分支以及在当前帧上计算可调质量的特征并在每个视频帧上执行时间更新的更新分支），实现高准确度和低推理成本。

Abstract

In this paper, we present accel, a novel semantic video segmentation system that achieves high accuracy at low inference times by combining the predictions of two network branches: (1) a →

发现论文，激发创造

超越语义图像分割：探索视频中高效推理的方法

探究CRF 推理模块的效率，将语义共同标记和更具表现力的模型结合起来，能够更有效地处理图像层次和区域层次的标记一致性和上下文。由此，本文将空间平滑和出现核扩展到视频数据上，以实现视频语义分割的最佳效果。

Jul, 2015

LinkNet：利用编码器表征进行高效的语义分割

本文提出了一种新的深度神经网络架构，使其能够在保持准确性的同时，无需显着增加参数数量，从而提高像素级语义分割的实时性能和效率。

Jun, 2017

低延迟视频语义分割

本研究提出了一种视频语义分割框架，该框架利用特征传播模块和自适应调度器相结合的方法，通过时间间隔自适应地融合特征并根据准确性预测动态分配计算量，以实现低延迟和高语义分割质量。实验结果表明，在与现有模型的比较中，该模型在Cityscapes和CamVid这两个数据集上获得了竞争性的性能，并将延迟从360 ms降低到119 ms。

Apr, 2018

每一帧都很重要：视频分割和光流联合学习

提出一种新的框架以实现视频语义分割和光流估计的联合训练，通过联合训练利用视频中已标记和未标记的帧，使视频语义分割和光流估计更加稳健并在相应任务中表现优异。

Nov, 2019

标签传播与细化的高效视频语义分割

本文提出了一种高清视频实时语义分割的混合GPU / CPU方法，并给出了一种称之为EVS的管道，该管道结合了CPU和GPU两种不同的处理方式，以优化视频帧率和分割准确度。

Dec, 2019

基于逐帧推理的高效语义视频分割

本文提出了一种有效的语义视频分割方法，借鉴于现有方法中将结果传播到相邻帧或使用其他帧提取帧表示时可能会导致不准确的结果或不平衡的延迟问题，我们在推理过程中采用逐帧方式处理，其中显式考虑帧与帧之间的时间一致性，并将此一致性嵌入到语义分割网络中。通过新的知识蒸馏方法，我们成功地缩小了紧凑型模型与大型模型之间的性能差距。我们的结果在Cityscapes和Camvid等流行基准测试中优于先前的基于关键帧的方法，并提高了与独立训练每帧的对应基线的时间一致性。

Feb, 2020

TapLab：利用压缩领域知识进行语义视频分割的快速框架

本文提出了一个名为 TapLab 的简单有效的框架，通过利用压缩视频中的知识来加速实时语义视频分割。通过使用运动矢量进行快速特征变形，以及使用残差解决因运动矢量引入的噪声，TapLab 将现有技术的冗余计算量减少了 3 到 10 倍，并在可控的精度下降的条件下实现了 99.8 FPS。

Mar, 2020

BiSeNet V2：带有引导聚合的双边网络用于实时语义分割

该研究提出了一种名为Bilateral Segmentation Network (BiSeNet V2)的神经网络架构，通过将空间细节和分类语义分别处理来实现高效准确的实时语义分割，并使用Detailed Branch和Semantic Branch来分别处理低级和高级特征。

Apr, 2020

AuxAdapt: 稳定高效的测试时间适应方法，用于保持视频语义分割的时序一致性

该论文提出了一种无监督在线适应方法，名为AuxAdapt，用于提高神经网络模型的时域一致性，通过利用一个辅助分割网络（AuxNet）对原始的分割网络（Main-Net）的决策进行针对性的修改，实现对视频序列的快速、准确、稳定的训练。

Oct, 2021

重访多尺度特征融合在语义分割中的应用

本文提出了一种使用多尺度特征融合网络和BiFPN来进行实时图像语义分割的方法ESeg，通过扩展传统的多尺度特征空间来实现，不需要高分辨率和昂贵的空洞卷积。实验证明，ESeg在多个数据集上的表现比先前的方法更准确，并且实时性能得到提升。

Mar, 2022