Mar, 2021

基于 Transformer 的多编码器学习和流融合的端到端自动语音识别

TL;DR通过研究多种融合技术和多编码器学习方法,以实现对变压器架构的最佳融合,仅在训练期间对两个编码器 - 解码器组合的多头注意权重输出进行加权组合,在推理时使用幅度特征编码器,成功地在 WSJ 上展示了一致的改进,并通过简单的后期融合在 WSJ 上取得了状态 - of-the-art 的表现。