Jan, 2024

通过双层优化实现语音自动识别的联合无监督和有监督训练

TL;DR本文提出了一种新颖的基于双层优化训练的方法来训练用于自动语音识别(ASR)任务的声学模型,称之为双层联合无监督和有监督训练(BL-JUST)。BL-JUST 通过使用无监督损失和有监督损失进行下层和上层优化,利用最新的基于惩罚的双层优化的进展来解决这个具有可负担复杂度和严格收敛保证的挑战性 ASR 问题。通过在 LibriSpeech 和 TED-LIUM v2 数据集上进行广泛实验来评估 BL-JUST,在常用的预训练和微调策略上 BL-JUST 实现了更优异的性能。