Jun, 2024
MR-RawNet:使用原始波形的多时间分辨率变长语音说话人验证系统
MR-RawNet: Speaker verification system with multiple temporal resolutions for variable duration utterances using raw waveforms
Seung-bin Kim, Chan-yeong Lim, Jungwoo Heo, Ju-ho Kim, Hyun-seo Shin...
TL;DR通过使用多分辨率特征提取器和多分辨率注意力块,MR-RawNet 能够从原始波形中提取时间 - 频率表示,增强说话人验证系统对可变持续时间的音频语句的抗干扰能力。实验结果表明,与其他基于原始波形的系统相比,MR-RawNet 在处理可变持续时间的音频语句时表现出更高的性能。