- 原来我并不真实:走向强大的 AI 生成视频检测
本文提出了一种用于检测由多个最先进的生成模型合成的视频的新框架,通过 CNN + LSTM 架构从扩散模型中提取显式知识的表征,并且在域内视频上实现了 93.7% 的检测准确率,并使域外视频的准确率提高了 16 个百分点。
- 基于 3D 时空轨迹的深度伪造视频压缩检测
该研究提出了一种基于 3D 时空轨迹的深度伪造视频检测方法,该方法通过利用鲁棒的 3D 模型构建时空运动特征,整合来自 2D 和 3D 帧的特征细节,以减轻大头部旋转角度或不足的光照对帧内的影响。此外,该方法将面部表情与头部运动分离,并设计 - 基于时空异常学习的 AI 生成视频检测
该研究探讨了有效的基于人工智能生成视频的检测方案,通过使用两个分支的时空卷积神经网络来捕捉取证迹象,对视频的空间和光流异常进行分析,通过融合子检测器的结果来提高判别能力,并构建了一个大规模生成的视频数据集作为模型训练和评估的基准。
- 基于缩略图布局和图推理的通用深伪视频检测
这篇研究论文介绍了一个简洁而有效的策略 TALL,通过将视频剪辑转化为预定义的布局以实现空间和时间依赖的保留。通过引入图推理块(GRB)和语义一致性(SC)损失来加强 TALL,并取得了优于或与最先进方法相媲美的结果,在各种深度伪造检测问题 - YONA: 仅一个相邻参考帧即可精准快速地检测视频息肉
本文提出了 YONA 算法,即仅需要一个相邻参考帧的视频息片段检测框架,通过自适应分配前景和背景模板样本来解决结肠镜视频中摄像机运动场景引起的视频颤动问题,同时通过交叉帧对比学习和引导对齐来大幅提高模型的性能和速度。
- 基于面部区域位移轨迹序列的人脸伪造检测
利用基于深度学习的技术来鉴别伪造的面部操作视频,特别是针对基于强制仿射变换的面部偏移位移轨迹进行提取和多维度的神经病网络构建,其中虚拟锚点和时空图注意力和门控循环单元成功检测出现多重伪造训练数据集中的假视频,该方法表现出了竞争力。
- 使用时空 Dropout Transformer 进行 Deepfake 视频检测
本文提出了一种基于空时 dropout 的深度学习算法用于视频检测,利用视觉变换器从视频中抽取局部区域的空时信息,配合空时 dropout 操作以提高模型的鲁棒性和泛化性。实验证明,该算法有效地解决了当前深度伪造视频的检测挑战。
- CVPR由音频叙述引导的弱监督行为检测
提出了一种基于多模态学习和叙述监督的视频检测模型,可以从嘈杂的音频叙述中学习动作检测,从而降低标注的费用。
- Context-LSTM:在 UCF101 上进行视频检测的强大分类器
本文旨在通过使用 LSTM 结构简化视频检测来降低训练时间和 GPU 内存使用,同时保持在 UCF101 数据集上的准确度,并实现视频动作检测的稳健性表现。
- 从视频素材中检测口罩的深度学习框架
该研究提出了一种基于深度学习的方法,利用 MTCNN 和 MobileNetV2 算法检测公共场所中戴口罩的人脸,使得公共场所的监督变得更加安全。
- 关于视频检测和跟踪的稳定性
本研究提出了一个新的视频检测评估指标,从稳定性和准确性两个方面考虑。通过将稳定性分解为三个方面的误差来表征其特征,并证明了稳定性和准确性指标之间的低相关性,为未来相关领域的研究提供了指导和坚实的基础。