Aug, 2023

2023 VoxCeleb 演讲者识别挑战中的 UNISOUND 系统

TL;DRUNISOUND 在 VoxCeleb 2023 声纹识别挑战中提出了一种基于 ResNet 和 RepVGG 架构的一致性感知分数校准方法,通过 Consistency Measure Factor(CMF)利用音频声纹的相似性分数稳定性,该方法大大提升了性能,在挑战中获得了第一名(Track 1)和第二名(Track 2)。