Jan, 2024

嘴唇说谎:识别唇同步 DeepFakes 中音频和视觉之间的时间不一致

TL;DR我们提出了一种新颖的方法,通过利用嘴唇运动和音频信号之间的不一致性,以及模拟嘴唇和头部区域之间的生物联系来进行唇诈骗识别,实验证明我们的方法在发现唇同步视频方面的平均准确率超过 95.3%,明显优于基准方法。这项研究在现实世界场景中取得了高达 90.2%的准确率,并显示了其在真实场景部署方面的强大功能。