关键词video semantic segmentation
搜索结果 - 27
- 视频语义分割的时间记忆注意力
该研究提出了一种基于自我注意力机制和长远时间关系的 Temporal Memory Attention Network(TMANet),来达到视频语义分割的最佳性能,尤其在 Cityscapes 和 CamVid 数据集上表现出新的最佳性能 - 快速视频语义分割的局部内存注意力
本文提出了一种新颖的神经网络模块,可以将现有的单帧语义分割模型转化为视频语义分割流水线,并将过去帧中的语义信息聚合到内存模块中,并通过关注机制来对其进行访问。通过将这些提示与当前帧的编码进行融合,可以改善 Cityscapes 数据集上的分 - 具有扭曲感知特征修正的视频语义分割
本文提出一种畸变感知的特征校正方法来改善视觉语义分割的性能,旨在将畸变的传播特征纠正回去,首先通过畸变模式预测方法将畸变模式从特征传回图像空间并利用其指导特征校正,实验表明此方法在 Cityscapes 和 CamVid 数据集上显著优于现 - CVPR快速视频语义分割的时态分布网络
该研究提出了一种名为 TDNet 的时态分布网络,旨在实现快速准确的视频语义分割,该网络使用深度卷积神经网络从视频中提取特征,并通过逐帧分布的方式,引入了新颖的注意力传播模块和分组知识蒸馏损失函数,从而达到了较高的分割准确率和更低的延迟。
- AAAI每一帧都很重要:视频分割和光流联合学习
提出一种新的框架以实现视频语义分割和光流估计的联合训练,通过联合训练利用视频中已标记和未标记的帧,使视频语义分割和光流估计更加稳健并在相应任务中表现优异。
- 语义视频分割:探索推理效率
本研究探讨了基于 CRF 推理在图像级别的语义分割之外,在视频帧中进行联合推理的效率,并结合语义共同标注和更具表现力的模型。在 CamVid 数据集上,通过 TextonBoost unaries,我们的提议方法在没有额外时间开销的情况下, - CVPR超越语义图像分割:探索视频中高效推理的方法
探究 CRF 推理模块的效率,将语义共同标记和更具表现力的模型结合起来,能够更有效地处理图像层次和区域层次的标记一致性和上下文。由此,本文将空间平滑和出现核扩展到视频数据上,以实现视频语义分割的最佳效果。