Jul, 2022

ESPnet-SE++:面向鲁棒语音识别、翻译和理解的语音增强

TL;DR本文介绍了将语音分离和增强(SSE)纳入 ESpnet 工具包的最新进展,包括最新的语音增强模型及其评估,并设计了新界面将语音增强应用于前端任务包括自动语音识别(ASR)、语音翻译(ST)和口语理解(SLU),实验表明其在多通道场景下是一种有前途的研究方向及可以用作未来研究的基准语料库。