Feb, 2022
短语音检测的文本无关说话人验证中多尺度频率通道注意力的 TDNN
MFA: TDNN with Multi-scale Frequency-channel Attention for Text-independent Speaker Verification with Short Utterances
Tianchi Liu, Rohan Kumar Das, Kong Aik Lee, Haizhou Li
TL;DR本研究提出了多尺度频道注意力机制(MFA),其采用新颖的双通道设计,即卷积神经网络和时延神经网络,可用于对不同尺度的讲话者进行表征,并在短语态测试语句下表现出优异的成绩,其在 VoxCeleb 数据库上表现出最先进的性能,同时减少了参数和计算复杂度。