Mar, 2022
推动原始波形扬声器识别的极限
Pushing the limits of raw waveform speaker recognition
Jee-weon Jung, You Jin Kim, Hee-Soo Heo, Bong-Jin Lee, Youngki Kwon...
TL;DR本文提出了一种基于原始波形的演讲者识别模型,它结合了机器学习和说话人认证的最新进展,其中包括 Res2Net 骨干模块和多层特征聚合。该模型具有很高的性能表现,可以应用于半监督学习场景中,即在只有少量标记训练数据和大量未标记训练数据的情况下,可用于说话人识别。