超越面部的视频处理：一份进行人机分析的数据集

Jul, 2022

超越面部的视频处理：一份进行人机分析的数据集

Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis

Trisha Mittal, Ritwik Sinha, Viswanathan Swaminathan, John Collomosse, Dinesh Manocha

TL;DR为了区分 “真实” 和 “篡改” 内容，在现代内容编辑工具成熟和基于人工智能的算法合成媒体不断发展的背景下，我们提出了 VideoSham 数据集，它包含 826 个视频（413 个真实和 413 个篡改）。该数据集具有更多元化、富于语境和以人为中心的高分辨率视频，使用 6 种不同的空间和时间攻击进行操作，我们分析发现，现有的最先进的检测算法只适用于少数几种攻击，并且不适用于 VideoSham。我们在 Amazon Mechanical Turk 上进行了用户研究，并深入分析了人类和 SOTA 算法的性能优劣，以确定需要更好的人工智能算法来填补差距。

Abstract

As tools for content editing mature, and artificial intelligence (AI) based algorithms for synthesizing media grow, the presence of manipulated content across online media is increasing. This phenomenon causes the spread of misinformation, creating a greater need to distinguish between

manipulated content deepfake dataset videosham manipulation detection algorithms user study

发现论文，激发创造

FaceForensics：一种用于在人脸中检测伪造的大规模视频数据集

通过引入新的半百万级别的面部操作数据集，本文提出了对诸如经典图像取证分类、分割、以及众多优化方法进行基准测试、鉴定的处理任务，包括压缩不同质量级别下的视频，并达到超越现有所有视频操纵数据集一个数量级的状态，旨在通过根据目标制作难以区分的赝品来进行基准评估。

Mar, 2018

FaceForensics++: 检测篡改的面部图像学习

本文对当前合成图像生成和处理技术的发展进行了探讨，并提出了一个基于 DeepFakes，Face2Face，FaceSwap 和 NeuralTextures 的面部操作检测基准，包括超过 180 万个操纵图像的数据库，并通过数据驱动型假冒检测器的详尽分析证明了使用额外领域特定知识的方法能够显著提高假冒检测的准确性。

Jan, 2019

VideoForensicsHQ：检测高质量的经过篡改的人脸视频

本文提出了一种新的人脸视频伪造检测数据集和检测器，通过使用空间和时间特征的组合，可以更准确地检测和识别被肉眼难以发现的视频伪造，且该方法具有更好的检测准确性和泛化能力。

May, 2020

朝着真实文本操纵检测的目标：新数据集和新解决方案

为了解决合成篡改无法充分复制真实世界篡改属性的问题，我们提出了一个 RTM 数据集，包含 14250 个文本图像，其中包括 5986 个手动和 5258 个自动篡改的图像，使用各种技术创建，同时还包括 3006 个未更改的文本图像，用于评估解决方案的稳定性。我们的评估表明现有的方法在 RTM 数据集上的文本伪造检测方面存在问题。我们提出了一个强大的基线解决方案，它采用一个一致性感知的聚合中心和一个门控交叉邻域注意融合模块用于高效的多模态信息融合，并在训练过程中采用一个被篡改 - 真实对比学习模块，丰富特征表示的差异。这个框架可以扩展到其他双流体系结构，对手动和总体篡改的定位性能分别提高了 7.33% 和 6.38%。我们的贡献旨在推动现实世界文本篡改检测的进展。代码和数据集将在此 https 网址上提供。

Dec, 2023

面部视频的深度语义处理

本文提出了一种基于神经渲染和基于 3D 面部表情建模的方法，支持语义视频操作，可以通过改变和控制面部表情实现交互式操作，实现了有希望的逼真效果，并且引入了用户友好的交互 AI 工具，可以处理关于特定部分的输入视频中期望的表情操作的可读的语义标签，并合成逼真的操作视频。

Nov, 2021

AV-Deepfake1M：大规模基于 LLM 的视听深度伪造数据集

本研究针对高度逼真的深度伪造音视频内容的检测和定位问题提出了 AV-Deepfake1M 数据集，并通过全面的描述和严格的数据质量分析，使用先进的深度伪造检测和定位方法进行了综合基准测试，结果显示与之前数据集相比性能大幅下降。该数据集将在构建下一代深度伪造定位方法中发挥重要作用。

Nov, 2023

DeepFakes 和更多：人脸处理和假图检测综述

本文综述了利用大规模公共数据库及深度学习技术（尤其是生成对抗网络）生成逼真虚假内容的技术及其在虚假新闻时代的社会影响，包括 DeepFake、面部属性操作和面部表情交换等四种类型的面部操纵技术，以及检测这些操纵方法的关键技术。同时，我们详细介绍了每种操纵类型的技术、公共数据库和关键指标，并着重介绍了最新一代的 DeepFakes 在虚假检测方面的改进和挑战。除了综述信息外，我们也讨论了该领域的未解决问题和未来趋势。

Jan, 2020

揭示幻觉：理解人类对音视频深度伪造的感知

人们对深度伪造视频的感知能力进行主观研究，结果显示机器学习模型相对于人类在同样的 40 个视频上有更好的表现，而人们又往往高估了自己的检测能力。这一研究结果有助于对比人类和机器的性能、推进法医分析，并实现自适应对策。

May, 2024

探索篡改检测中的显著性偏见

通过分析流行的图像操纵数据集中的视觉和语义显著趋势及其对检测的影响，我们提出了一个框架，以促进语义感知的法庭取证方法的进一步发展，从而了解视觉误导现象。

Feb, 2024

不是所有的假新闻都是文字：一个关于误导性视频标题的数据集和分析

通过收集和注释 Multimodal Video Misleading Headline（VMH）数据集，我们分析了侦测误导性标题的多模态基线，同时注重了注释者对视频误导性的看法和背景与视频内容之间的相互作用。

Oct, 2023