Apr, 2020

SpEx: 多尺度时域说话人提取网络

TL;DR通过提出 SpEx 网络并采用多尺度嵌入系数,将多说话声音信号转换成特定发言人的声音信号,该网络在信号畸变比(SDR)、比例尺不变信号畸变比(SI-SDR)和语音质量评估(PESQ)等方面均有显著改进。