利用运动线索进行弱监督语义分割
本研究提出了一种快速卷积神经网络 (FCNN),并使用多阶段的深度学习来整合外观和动态线索进行人群分割,成功使用我们自己创建的具有 235 和 11 个场景的人群分割数据集对我们的方法进行了评估。
Nov, 2014
本文介绍了一种使用图像标签进行弱监督语义分割的模型,利用图像标注作为注意机制来识别图像中的语义区域,并描述了如何将此掩模生成策略纳入完全端到端可训练的过程中,其中网络同时学习对图像进行分类和分割,实验表明,利用生成的类特定掩模可以超越只使用图像标记的最新弱监督语义分割方法甚至某些利用额外监督或训练数据的模型。
Apr, 2018
该论文提出了一种半监督方法来适应经过标记的图像数据训练的 CNN 图像识别模型到目标域,利用 CNN 学到的语义证据和视频数据的内在结构进行视频语义对象分割,显式地建模并补偿从源域到目标域的领域转移,并展示了我们的方法在具有挑战性的数据集上相对于现有方法的卓越性能。
Jun, 2016
作者提出一种针对弱监督和半监督学习条件下的语义图像分割模型训练的 Expectation-Maximization 方法,实验表明所提技术具有竞争性的成果,同时需求更少的标注工作量。
Feb, 2015
本文提出了一种基于神经网络的视频分割方法,用于区分视频帧中独立运动的物体,并利用对象运动、外观和时间一致性等多个信息源,通过对数据进行训练得到模型,经过评估表明该模型在 DAVIS、Freiburg-Berkeley 运动分割数据集和 SegTrack 等数据集上表现良好。
Dec, 2017
本文提出了一种基于深度学习的直接运动估计方法,在缺乏大规模数据集的情况下,采用无监督学习的方式训练网络,使用光流约束作为优化代价函数,通过反向传播算法进行误差传递以优化网络,实验证明该方法在合成图像与实际图像序列中的表现都接近于当今最先进的方法。
Jan, 2016
该论文介绍了一种新颖的弱监督语义分割算法,该算法利用基于深度卷积神经网络的辅助分割注释,通过设计解耦编码器 - 解码器体系结构来生成空间高光区域,并使用注意力模型和分割注解在不同类型中加速弱监督下的语义分割。 训练该模型可以在 Microsoft COCO 数据集中的 60 个独家类别的注释下,显着提高在具有挑战性的 PASCAL VOC 2012 数据集中的表现。
Dec, 2015
本文提出了基于新型弱标注的视频显著目标检测模型,并使用外观运动融合模块和双向 ConvLSTM 框架来实现有效的多模态学习和长期时序建模,还设计了一种前景背景相似度损失和一种弱标注增强策略,以提高模型性能和伪标签生成技术。在六个基准视频显著性检测数据集上的实验结果证明了我们方案的有效性。
Apr, 2021
本文介绍了一种称为 MotionFit 的自训练方法,采用 3D 卷积神经网络、运动模型和假标签来提高视频下游任务的效果。该方法在小规模视频数据集中表现优异,远超其他知识迁移算法、半监督学习和仅使用视频的自我监督学习。
May, 2021
我们提出了一个名为约束卷积神经网络的方法,它使用一种新的损失函数来优化 CNN 模型输出空间上任何一组线性约束条件,并且通过大量实验得出该方法在弱监督语义图像分割任务中表现出卓越的效果。
Jun, 2015