May, 2024

Codecfake 数据集与深伪造音频的普适检测对策

TL;DR该研究主要关注基于音频语言模型(ALM)的深度伪造音频的检测方法,提出了 CSAM 策略来解决原始 SAM 的领域上升偏差问题,并通过 Codecfake 数据集和 vocoded 数据集的共同训练,在各种测试条件下实现了最低的平均等错误率(EER)为 0.616%。