AViD 数据集:来自多个国家的匿名视频
本文介绍了新采集的 Action Recognition in the Dark(ARID)数据集,用于行为识别。研究分析了该数据集,并评估了当前行为识别模型及框架增强方法对于暗视频识别的效果。结果表明,现有的行为识别模型和框架增强方法不适用于暗视频的行为识别任务。
Jun, 2020
本文提出一种带有隐私保护机制的视频动作识别模型,通过敌对训练来寻找能够最佳平衡目标任务性能与隐私保护程度的匿名转换方法,并给出了两种优化策略以实现对于攻击模型的普适隐私保护。同时,构建了一种全新的视频数据集 PA-HMDB51,为视觉隐私研究提供了有力支持。
Jun, 2019
本文介绍了一个新的大规模 RGB-D 数据集,其中包括固定视角和全方位视角下的 40 种行动,以及 VS-CNN 模型的提出和有效性验证,该模型可用于解决任意视角下行动识别的问题。
Apr, 2019
该论文提出了一种新的方法来学习视频脸部匿名化,使用对抗训练设置,在像素级别修改以匿名化每个人的脸,以确保隐私敏感信息得到删除,并尽量减少对行动检测性能的影响。
Mar, 2018
该论文介绍了 AVA-Kinetics 本地化人类行为视频数据集,其中包含超过 230k 个帧,对每个人的关键帧进行了 80 个 AVA 动作类的注释,通过视频行动变换网络在 AVA-Kinetics 数据集上进行了基线评估,并证明了在 AVA 测试集上行动分类的表现有所改善。
May, 2020
介绍了第一个用于真实场景交通异常检测的音频 - 视觉数据集 MAVAD,并提出了一种名为 AVACA 的新方法,它通过交叉注意提取视频序列中的视觉和音频特征来检测异常。演示了音频的加入将 AVACA 方法提高了 5.2%的性能,并评估了图像匿名化的影响,结果表明此影响仅对性能平均下降 1.7%。
May, 2023
本文介绍了一个 Mobile Identity Document Video 数据集 (MIDV-500),其中包含来自 50 个不同身份证件类型的 500 个视频剪辑,提供了地面真实性,方便进行广泛的文档分析问题的研究,同时给出了人脸检测、文字行识别和文档域数据抽取的评估结果。
Jul, 2018
介绍一个新的视频数据集 AVA,其中定义了 80 个原子视觉动作并进行了精确的时空注释,可以帮助改进动作识别。提出了一种基于现有方法的新方法,针对 JHMDB 和 UCF101-24 类别的表现更佳,但在 AVA 上仍需开发新的视频理解方法,表明该数据集暴露了动作识别的内在困难。
May, 2017
这篇研究论文介绍了一个有用的 TikTok 视频数据集,可用于公众使用,并揭示了增加预训练数据集大小对基于视频的基础模型的边际效益。
Feb, 2024