Jul, 2022

超越面部的视频处理:一份进行人机分析的数据集

TL;DR为了区分 “真实” 和 “篡改” 内容,在现代内容编辑工具成熟和基于人工智能的算法合成媒体不断发展的背景下,我们提出了 VideoSham 数据集,它包含 826 个视频(413 个真实和 413 个篡改)。该数据集具有更多元化、富于语境和以人为中心的高分辨率视频,使用 6 种不同的空间和时间攻击进行操作,我们分析发现,现有的最先进的检测算法只适用于少数几种攻击,并且不适用于 VideoSham。我们在 Amazon Mechanical Turk 上进行了用户研究,并深入分析了人类和 SOTA 算法的性能优劣,以确定需要更好的人工智能算法来填补差距。