Oct, 2022

NIST 2020 SRE CTS 挑战中的 THUEE 系统介绍

TL;DR本文介绍了 THUEE 团队在 NIST 2020 演讲者识别评估(SRE)会话电话语音(CTS)挑战中所采用的系统描述。在该评估中,我们采用了包括 ResNet74、ResNet152 和 RepVGG-B2 在内的子系统作为说话人嵌入提取器,并使用结合的 AM-Softmax 和 AAM-Softmax 基于损失函数(即 CM-Softmax)来进一步提高系统性能的两阶段培训策略。我们将所有单个系统融合为我们的最终提交,这种方法表现出优秀的性能,并在挑战中排名第一。