ICMLFeb, 2024

利用基于语义相似度的图结构进行高效数据选择的模型训练

TL;DR该研究论文介绍了一种有效的数据抽样机制,通过基于文本信息而不经过计算密集型模型或其他密集预处理转换,将新数据点分类为语音识别难度桶。结果表明,使用该方法比随机预测提高了 93% 的 ASR 性能精确度,并对文本表示在语音模型中的影响提供了重要信息。此外,一系列的实验证明了使用 ASR 信息对模型进行细调的益处和挑战。与随机抽样相比,报告了 7% 的验证损失下降,针对高难度数据集的非局部聚合的 WER 降低了 7%,并且在数据集之间具有高语义相似性的局部聚合下,WER 降低了 1.8%。