May, 2024

利用大规模预训练模型进行无需训练的深度伪造语音识别

TL;DR通过使用大规模预训练模型,将音频深度伪造检测问题转化为说话人验证框架,利用被测声音样本和所声称身份的声音间的不匹配暴露假音频,实现了对广义能力的全面泛化。实验表明,基于预训练模型的检测器在内部数据上与监督方法不相上下,在外部数据上则大幅超越监督方法。