May, 2024

AudioSetMix: 用 LLM 辅助增强音频 - 语言数据集

TL;DR我们通过增加自然语言标签和相应的音频信号处理操作,使用大型语言模型提供了一个高质量的训练数据集,该数据集在文本和音频相关模型的基准测试中提供了多样化且更好对齐的示例,从而改善了模型的性能。