ObjectMix:在视频中通过复制黏贴对象进行数据增强,以进行动作识别
在视频分类任务中,我们首次系统地分析了各种数据增强策略的有效性,并提出了一个强大的增强策略 VideoMix,该策略通过将视频立方体插入另一个视频来创建新的训练视频;在各种数据增强基准上,VideoMix 一直表现优秀,在 Kinetics、Something-Something-V2 基准测试中始终优于其他增强基线,并提高了 THUMOS'14 中弱监督的动作定位性能和 AVA 中的视频检测任务。
Dec, 2020
本文介绍了 S3Aug,一种用于动作识别的视频数据增强方法。该方法通过分割和标签转换,从单个训练视频生成新的视频,并通过采样修改某些类别的标签图像,以生成多样的视频,并通过移动中间特征来增强生成视频帧之间的时间连贯性。通过在 UCF101、HMDB51 和 Mimetics 数据集上的实验证明了所提方法的有效性,尤其对于 Mimetics 数据集中的非上下文视频。
Oct, 2023
本论文针对计算机视觉中重要的挑战之一 —— 构建数据有效且能处理罕见对象类别的实例分割模型,研究了一种使用数据增强方法的 Copy-Paste 方法,并发现简单的随机粘贴对象机制足以提供良好的性能,并且能够与半监督学习方法相结合获得更好的结果。在 COCO 实例分割任务和 LVIS 评测中,该方法均获得了优异的表现。
Dec, 2020
通过研究发现,基于图像显著性信息的数据混合并不一定对增强性能有太大帮助,采用更有效、更易于实现的 ResizeMix 方法进行数据混合比 CutMix 和基于显著性信息的方法更具优势。
Dec, 2020
本文研究利用 CNN 和基于 Transformer 的物体检测器,在遥感应用中提出了一种新的增强方法 —— 拼贴拼贴,并与 PixMix 增强方法结合,实现对物体密度的更好控制,以提高检测器的性能和鲁棒性。
May, 2023
在本文中,我们提出了一种名为选择性体积混合(SV-Mix)的视频增强策略,以改善在训练样本有限的情况下深度模型的泛化能力,在各种视频动作识别基准上提升了基于 CNN 和 Transformer 模型的性能。
Sep, 2023
采用鲁棒的数据增强技术和深度学习架构,通过提出一种新的数据增强技术、采用混合任务级联(HTC)框架和 CBNetV2 作为骨干架构以及引入 Stochastic Weight Averaging(SWA)训练策略,该论文在篮球场景中分割人体主体方面取得了显著的遮挡得分(OM)。
Oct, 2023
使用不同的数据增强策略对视频进行数据增强,结合现有的半监督学习框架,能够在低标签模式下提高 Kinetics-100/400, Mini-Something-v2, UCF-101 和 HMDB-51 数据集的性能,并在完全监督的情况下证明提高了性能。
Mar, 2021
本文提出了一种称为 Background Mixup 的数据增强方法来提高手对象检测的性能,通过混合不包含手和物体的背景图像来防止意外偏差,有效地减少假阳性,适用于监督和半监督学习。
Feb, 2022
本文提出了一种基于弱监督学习框架的对象实例分割方法,使用对抗训练的方法学习对象掩模,利用剪切 - 粘贴的游戏过程,通过掩模生成器和区分器的协同作用来实现分割掩模的优化,实验结果表明,该方法在不需要手工标注分割建议的情况下,可以超越现有的弱监督分割方法,并获得了 90% 的监督分割性能。
Mar, 2018