Oct, 2024

Synthio:利用合成数据增强小规模音频分类数据集

TL;DR本研究针对小规模音频分类数据集中标签数据不足的问题,提出了一种名为Synthio的新方法,通过合成音频数据增强数据集。该方法通过优化T2A模型与小规模数据集之间的对齐,结合大语言模型生成多样化的音频标签,从而显著提高了分类准确率,在多项数据集上显示出优于传统基线的性能。