Jun, 2024

构建端到端多语言自动歌词转录模型

TL;DR基于可用数据集,本文旨在创建一个能够进行多语言自动歌词转录的系统,并通过扩展目标词汇集合将已被证明在英语自动歌词转录中有效的技术应用于多语言场景。通过语言分析结合语言分类性能,我们的研究发现多语言模型的性能连续优于仅针对语言子集进行训练的单语言模型,并且将语言信息纳入模型中显著提高性能。