Mar, 2022

推动原始波形扬声器识别的极限

TL;DR本文提出了一种基于原始波形的演讲者识别模型,它结合了机器学习和说话人认证的最新进展,其中包括 Res2Net 骨干模块和多层特征聚合。该模型具有很高的性能表现,可以应用于半监督学习场景中,即在只有少量标记训练数据和大量未标记训练数据的情况下,可用于说话人识别。