Apr, 2019
RawNet: 使用原始波形的高级端到端深度神经网络进行文本独立说话人验证
RawNet: Advanced end-to-end deep neural network using raw waveforms for text-independent speaker verification
Jee-weon Jung, Hee-Soo Heo, Ju-ho Kim, Hye-jin Shim, Ha-Jin Yu
TL;DR本文提出了一种端到端的系统,该系统包含两个深度神经网络,其一个用于提取语音级别的说话者嵌入,另一个用于后端分类,通过具有预训练方案的模型架构调整可以提取说话者嵌入,并使用附加目标函数简化提取过程,此系统在 VoxCeleb1 数据集上实现了同等于具有数据增强的最先进的 x 向量系统的表现。