- ICCV通用事件边界检测:事件分割的基准测试
本研究提出了一项新任务及其新基准,用于检测将整个视频分割成块的通用、无分类学的事件边界。
- 实时本地化光真实视频风格转换
本文提出了一种基于深度神经网络的算法,通过将图像的语义有意义的本地区域的艺术风格转移至目标视频的本地区域,同时保持其照片般的逼真性,并通过噪声和时间损失来优化视频的语义标签和平滑转换风格,最终实现一种能够自动生成视觉媒体的风格迁移方法。
- TSPNet: 基于时间语义金字塔的手语翻译分层特征学习
本文提出了一种基于多种时间粒度的新型手语视频片段表示法,通过时空语义金字塔网络 (TSPNet) 来实现手势识别和特征学习,该方法加强了前沿技术的表现并优化了手语翻译过程。
- ECCV用于长距离视频理解的时间聚合表示
本文提出了一种灵活的多粒度时间聚合框架,用简单的技术如最大池化和注意力实现了最新的下一步行动和密集预测,并在 Breakfast,50Salads 和 EPIC-Kitchens 数据集上取得了最新的实验结果,且兼容于视频分割和动作识别。
- ICCV利用时间性进行半监督视频分割
本文提出了一种端到端可训练的深度学习模型,利用时间信息来利用易于获取的未标记数据,从而解决了视频分割中标签稀缺的问题。实验结果表明,该模型能够显著优于基线方法和逐帧图像分割。
- 自监督学习的视频对应流
本文提出了一种适用于匹配视频中对应点的特征嵌入的自监督学习方法,其中使用自然的时空一致性训练指针模型,并通过引入信息瓶颈和循环模型等方式来解决跟踪器漂移等挑战,最终取得了在视频分割和关键点跟踪上的最佳效果。
- CVPR重新思考视频摘要的评估
本文主要研究视频摘要中的评估方法,并提出了基于视频分割的替代方法,在使用两个知名的基准数据集进行研究时,惊奇地发现随机生成的视频摘要达到了与人类生成的摘要相当甚至更好的性能表现,并且视频分割对性能指标的影响最大。
- 多光谱立体视频在线互相前景分割
本文提出了一种同时解决多光谱分割和立体匹配的方法,通过使用多光谱相机以提供多样的数据、使用迭代过程估计另一个问题的标签结果、使用能量函数进行处理以及使用高阶项来提高时间上的一致性。
- ECCVYouTube-VOS: 序列到序列视频物体分割
本文介绍了一个基于大规模数据集的序列 - 序列网络,能够充分利用视频的长期时空信息进行分割,在 YouTube-VOS 测试集上取得了最佳结果,在 DAVIS 2016 上与现有最先进方法相比也有可比性。
- MM视频实例级人体解析的自适应时间编码网络
该论文通过提出一种新型的自适应时间编码网络(ATEN)来实现视频级别的人体分割,旨在同时分割每个人物实例并将每个实例解析为更细粒度的部分,从而通过平衡帧级别的准确性和时间效率解决视频对象分割研究中的重要问题。
- 变量计算预算的循环分割
本文提出了一种递归神经网络用于语义图像分割,该网络可在各种计算预算的范围内部署,并可用于有效地分割静态图像和视频。该方法通过利用先前帧的分割来进行视频分割,在降低计算成本的同时保持了分割质量。
- CVPR基于重识别的视频目标分割
本文提出了一种基于视频对象重识别的视频分割方法,通过使用自适应的目标重识别机制来避免传统方法中的漂移问题和无法处理大位移的弊端,该方法在 2017 年 DAVIS Challenge 中取得了最佳性能。
- 选择性视频对象抠图
本文提出了一种基于金字塔直方图的置信度图和基于测地距离的动态模型的视频分割方法,使用本地分类器进行不确定性传递来确定图像区域,并通过对不确定区域的精细化加工得到前景分割结果。此方法能极大地减少手动标注,提高分割性能。在两个标准测试集上进行的 - CVPR利用网络爬虫视频的弱监督语义分割
本文提出一种基于图像级别类别标签的弱监督语义分割算法,利用 Web 存储库中有关目标类别标签的视频检索并从检索到的视频中生成分割标签以模拟语义分割的强监督,该算法明显优于现有的同等监督方法,甚至与依赖额外标注方法的方法一样有竞争力。
- 基于全卷积递归网络的视频分割
本文提出了基于卷积门控循环单元网络的在线视频分割方法,利用滑动窗口对时间数据进行处理,并在变化检测数据集上进行实验,相比于常规的全卷积神经网络有 5.5% 的性能提升。
- ICCV多分辨率分层共聚类技术在带有微小变化序列的语义分割中的应用
该论文提出了一种基于层次结构的协同聚类技术,可以对图像集合进行多分辨率表示。通过线性规划松弛方法解决二次半分配问题,从而实现了对节点的聚类。该技术在视频分割算法中取得了最佳的实时结果。
- 基于因果图的视频分割
本文提出了一种有效的视频分割方法,以一种因果的方式计算时间上连续的像素,填补因素和实时应用的需求,从而加强了图像处理和计算机视觉的分析成果。