May, 2023

RASR2: 通用序列到序列语音识别的 RWTH ASR 工具包

TL;DR本文提出了一种名为 RASR2 的研究性通用 S2S 解码器,它支持多种 S2S 模型、语言模型、标签单元 / 拓扑和神经网络架构,并提供了对不同搜索模式和设置的丰富支持,因此可以有效地对开放词汇和闭合词汇场景进行解码。作者通过在 Switchboard 和 Librispeech 语料库上进行了广泛的实验证明了 RASR2 的效果,并在线公开了其源代码。