Jul, 2024

振动声学: 用身体传导音频传感器捕捉的法语语音数据集

TL;DRVibravox是一份符合《通用数据保护条例》(GDPR)的数据集,包含使用五个不同体导音频传感器的录音:两个耳机麦克风、两个骨导振动拾音器和一个喉麦。该数据集还包含来自空中麦克风的音频数据作为参考。Vibravox语料库包含188位参与者在由高阶环绕音3D定位技术施加的不同声学条件下进行的38小时的语音样本和生理声音记录。该语料库还包括关于录音条件和语言转录的注释。我们使用最先进的模型进行了一系列与语音相关的任务的实验,包括语音识别、语音增强和说话人验证。这些实验是通过评估和比较Vibravox数据集中不同音频传感器捕获的信号的性能来进行的,旨在更好地了解它们的个别特征。