Feb, 2024

一种新的声音真实性方法

TL;DR声音伪造,驱动主要是最近文本到语音合成技术的进展,对社会提出了重大挑战。我们主张从传统的二元范式即声音是 “真实” 或 “伪造” 进行观念转变,而将重点放在定位 “声音编辑” 上,这包括传统的修改、过滤和剪辑,以及文本到语音合成和语音变换系统。我们提出了六个类别,并策划了一个基于 M-AILABS 语料库的新挑战数据集,并提供了基线检测系统。我们认为,仅将声音分类为真实或伪造是一种危险的过度简化,将不能推动语音技术领域的发展。