Jun, 2024

MR-RawNet:使用原始波形的多时间分辨率变长语音说话人验证系统

TL;DR通过使用多分辨率特征提取器和多分辨率注意力块,MR-RawNet 能够从原始波形中提取时间 - 频率表示,增强说话人验证系统对可变持续时间的音频语句的抗干扰能力。实验结果表明,与其他基于原始波形的系统相比,MR-RawNet 在处理可变持续时间的音频语句时表现出更高的性能。