Nov, 2022

EURO: ESPnet 无监督自动语音识别开源工具包

TL;DR本文描述了 ESPnet Unsupervised ASR Open-source Toolkit (EURO),这是一个用于无监督自动语音识别 (UASR) 的端到端开源工具包,它采用了 Wav2vec-U 的最先进的学习方法,综合 27 个自我监督模型和各种基于图形的解码策略。EURO 通过对 ESPnet 的现有数据集进行完整的设置,提高了流水线的效率,并在 TIMIT 和 LibriSpeech 数据集上取得了最先进的 UASR 性能。