- FireMatch: 基于一致性和分布对齐的半监督视频火灾检测网络
基于半监督学习的火灾检测模型 FireMatch,结合了一致性正则化和对抗分布对齐,通过伪标签和视频增强等技术,扩展训练数据量,提高了分类性能和模型鲁棒性,实验结果表明该方法在真实火灾数据集上的准确率显著优于当前最先进的半监督分类方法。
- 基于时空可变注意力的乳腺病变视频检测框架
通过引入空间 - 时间变形注意力模块实现局部空间 - 时间特征融合,本研究提出的 STNet 在每个编码器和解码器阶段都能有效地进行深度特征聚合,同时引入编码器特征洗牌策略提高多帧预测的检测速度。实验结果显示,STNet 在公共乳腺病变超声 - 基于视频的可见光与红外人员再识别学习模态不变性和时间记忆
本研究主要研究基于视频的跨模态人员重新识别方法。通过构建一个视频 RGB-IR 数据集,证明了在 RGB-IR 人员重新识别中,视频到视频的匹配非常重要。此外,还提出了一种新的方法,该方法不仅将两种模态投射到模态不变的子空间中,还提取了时间 - 具有时间约束的视频雨滴去除与特征对齐
本研究提出一种基于视频的贴附式雨滴去除方法,分为单图像模块和多帧模块两个阶段,前者使用雨滴去除网络生成初步结果,后者根据多帧输入和输出之间的时空关系进行进一步优化,采用非监督学习方法进行贴附式雨滴去除。
- ECCV通过学习时间一致性进行动作识别的无源视频域自适应
本研究提出了一种名为 ATCoN 的新的注意力机制深度神经网络,以解决视频领域无源域自适应的挑战,该网络通过学习特征一致性和源预测一致性来提高时间一致性,并使用预测置信度优化局部与整体时间特征,该方法在不同领域的动作识别基准中表现出卓越的性 - 基于内存的视频虚拟试穿网络
提出了一种基于记忆的视频虚拟试衣网络(MV-TON),它可以在不需要任何服装模板的情况下,通过姿势对齐和区域替换像素,将所需的衣服无缝传输到目标人身上,并生成高分辨率逼真的视频
- 基于时空变换器的视频行人重新识别
本研究将 Transformer 应用于基于视频的人体再识别,提出一种新的基于预训练的模型,并使用感知约束的时空 Transformer 模块和全局 Transformer 模块转换到下游域,取得了显著的准确率提高。
- ECCV基于外观保持的三维卷积用于视频人物重新识别
提出了一种 AppearancePreserving 3D Convolution 方法,由 Appearance-Preserving Module (APM) 和 3D 卷积核组成,可对齐相邻的特征图从而在维持外观表示质量的前提下模拟时 - 隐私保护深度行动识别:对抗学习框架和新数据集
本文提出一种带有隐私保护机制的视频动作识别模型,通过敌对训练来寻找能够最佳平衡目标任务性能与隐私保护程度的匿名转换方法,并给出了两种优化策略以实现对于攻击模型的普适隐私保护。同时,构建了一种全新的视频数据集 PA-HMDB51,为视觉隐私研 - EMNLPTVQA: 本地化、组合式视频问答
本文提出 TVQA,一个基于 6 个流行电视节目的大规模视频问答数据集,共计包含 152,545 对 QA 对,分布在 21,793 个片段中,共涵盖了 460 小时的视频。该数据集中的问题具有组合性质,需要系统联合定位剪辑中的相关片段,理 - AAAI大规模人员再识别的基于区域的质量估计网络
通过提出一个新的基于区域质量估计的神经网络模型,本文旨在解决基于视频的人员重识别中由于遮挡、模糊和光照引起的噪声问题,并提供了一个高质量的人员重识别数据集,通过实验在不同数据集上的准确率均达到 90% 以上。
- ICCV视频行人再识别中的联合注意力时空池化网络
本篇论文提出了一种新的联合空间和时间注意力池化网络(ASTPN)用于基于视频的人物再识别,能让特征提取器意识到当前输入的视频序列,而空间和注意力时间池化层都能从距离匹配信息中筛选出有代表性的人物并对其进行学习,实验证明可以优于现有的 sta - 视频人员再识别的紧凑外貌表示学习
本文介绍了使用多个卷积神经网络的视频人物重新识别的新方法,利用步态对连续帧进行筛选选取代表帧,利用特征池化提取特征进行身份鉴定的紧凑描述,实验证明该方法比现有方法更优。
- 无监督视频匹配的个体再识别
本文提出了一种基于时间序列的视频人员重识别方法,可以准确地匹配任意不对齐的图像序列中的人,无需标记的成对数据,并通过引入时间移动动态时间扭曲 (TS-DTW) 模型实现自动对齐、数据选择和匹配。
- 人物再识别:过去、现在和未来
这篇文章介绍了人员再识别技术及其发展历史,对手工算法和深度学习算法在画面和视频再识别任务中的表现进行了概述,描述了未来方向和需要提高的问题。
- ECCV时序段网络:深度动作识别的良好实践
本文提出了一种新的视频动作识别框架 - TSN,并探究了在时间段网络的帮助下学习 ConvNet 模型的一系列良好实践策略。实验结果表明,本方法在 HMDB51(69.4%)和 UCF101(94.2%)数据集上取得了最先进的性能。我们还可 - 基于时间信息的 DCNN 细粒度物体分类
本文提出了基于视频的细粒度物体分类的新颖任务,并介绍了相应的新视频数据集。我们对几种最近基于深度卷积神经网络的方法进行了系统研究,并将它们专门适应任务