Jun, 2023

基于对比学习的多语言音频与歌词对齐

TL;DR本文介绍了一种新颖的歌词对齐系统,使用对抗学习导出跨模态嵌入,不仅训练简单、能使用弱标注数据、学习强大的文本模型,而且可用于多语言和获得了标准数据集下平均绝对误差小于 0.2 秒的最佳结果。