Jun, 2024

用合成标题改进文本到音频模型

TL;DR通过语音标注管道,使用音频语言模型合成准确且多样的音频标注,提供了合成标注数据集以及训练基于合成标注的文本转音频模型,取得了新的最先进的结果。