Feb, 2022

短语音检测的文本无关说话人验证中多尺度频率通道注意力的 TDNN

TL;DR本研究提出了多尺度频道注意力机制(MFA),其采用新颖的双通道设计,即卷积神经网络和时延神经网络,可用于对不同尺度的讲话者进行表征,并在短语态测试语句下表现出优异的成绩,其在 VoxCeleb 数据库上表现出最先进的性能,同时减少了参数和计算复杂度。