Jun, 2024

4D ASR: 联合波束搜索综合 CTC、注意力、转导和掩码预测解码器

TL;DR我们提出了一种联合建模方案,通过多任务学习和三种新的单通道波束搜索算法,我们训练出的 4D 模型在端到端自动语音识别上取得了更好的性能,并超过了使用单个解码器的模型。