Aug, 2024

基于对比学习的多语言声音与人脸关联链聚类

TL;DR本研究针对多语言环境中人脸与声音的关联问题,提出了一种基于对比学习的链聚类方法,以增强人脸声音的关联性。我们的研究采用监督的交叉对比学习建立多语言场景下的鲁棒关联,并通过链聚类后处理步骤减少无约束数据中的异常值影响。实验结果表明,该方法在FAME2024挑战中表现优异,位列第二,验证了其鲁棒性和有效性。