Feb, 2024

混合模型中交替使用弱三音素 / BPE 对齐监督改善端到端 ASR

TL;DR通过交替使用弱三音素 / BPE 对齐辅助训练模型,建议在中间层和编码器中使用三音素和 BPE 对齐计算交叉熵中间辅助损失来提高自动语音识别性能,同时降低字错率 10% 以上。