Jan, 2024

主动检测基于区域水印的语音克隆

TL;DR在语音生成模型的快速发展领域中,为了确保音频的真实性并防范声音克隆的风险,我们提出了 AudioSeal,这是第一种专门用于局部检测人工智能生成语音的音频水印技术。通过采用一个同时训练的生成器 / 检测器架构,结合一个可在采样级别上进行局部水印检测的本地化损失以及受到听觉掩蔽启发的新型感知损失,AudioSeal 在抗真实生活音频处理和无感知性方面取得了最先进的性能,据自动和人工评估指标显示。此外,AudioSeal 设计了一个快速的单通道检测器,其检测速度显著超过现有模型达到两个数量级,使其非常适合大规模和实时应用。