本文提出一种基于神经网络的半监督视频目标分割技术,能够在保证处理速度的前提下提升目标分割的效果。
Nov, 2016
该论文利用全卷积神经网络架构,基于 ImageNet 上学习的通用语义信息,结合单个对象的外观学习,实现了半监督的视频对象分割,提高了结果的精度和效率。
Sep, 2017
本文提出了第一个完全无监督的方法,用于在真实场景的序列中分割多个对象,通过空间绑定对象并将这些槽联系起来,在高级语义特征空间中重建中间帧,解决了效率和规范化问题,成功地在 YouTube 视频中分割了复杂且多变的类别的多个实例。
Oct, 2023
通过结合基于类别的目标检测、类别独立的目标外观分割和时间上的目标追踪等方法,通过训练全卷积网络对视频中的特定对象外观进行独立的分割,再引入对检测框时间上的连续性约束,从而实现半监督视频目标分割。
Jul, 2017
通过开发一个统一的框架,其中同时建模跨帧密集对应以进行本地区分特征学习并嵌入对象级上下文进行目标掩码解码,从而使得能够直接从未标记的视频中学习执行基于掩码的连续分割,而不是依赖于基于像素的关联的廉价 “复制” 标签的非直接方法。
Mar, 2023
提出了一种用于半监督视频对象分割的新型解决方案,通过利用内存网络中的可用线索和遍历所有可用源中的相关信息来实现更好的处理外观变化和遮挡等挑战,从而实现了最先进的性能。
Apr, 2019
本文介绍了一种基于深度学习的视频对象分割方法,将其作为引导实例分割的概念,通过离线和在线学习策略,使卷积神经网络能够处理多种输入注释并在多个数据集上获得具有竞争力的结果。
Dec, 2016
本文提出了一种有效的无监督方法,基于高可能的正面特征的自动选择和学习,生成前景对象软分割遮罩
Apr, 2017
通过结合基于 SfM 的 SAM 模型将视频中的目标进行分割和跟踪的方法,提出一种减少手动注释工作量的视频对象跟踪系统。系统性能经过计算时间、与手动标签的掩码 IOU 和跟踪损失数量等三个指标的评估,结果表明该系统在跟踪视频帧中的物体方面较人工表现有显著计算时间改善,但在性能上存在一定程度的退化。
我们提出了一个用于视频语义分割(VSS)的新解决方案 THE-Mask,首次引入了时态感知的分层物体查询,并利用简单的两轮匹配机制,在训练过程中以最小代价匹配更多的查询对象,同时在推理过程中无需任何额外代价。为了支持多对一的分配,我们设计了一种分层损失来训练带有相应主次层级关系的查询。此外,为了有效捕捉帧间的时态信息,我们提出了一个时态聚合解码器,以无缝融入 VSS 的掩码分类模型,利用时态敏感的多级查询方法,在最新的具有挑战性的 VSS 基准 VSPW 上取得了最先进的性能。
Sep, 2023