May, 2023

FunASR:一个基础的端到端语音识别工具包

TL;DRFunASR 是一种开源的语音识别工具箱,其中最具代表性的 Paraformer 模型是一种非自回归端到端语音识别模型,经过手动注释的中文语音识别数据集的训练,同时还开放了基于 FSMN-VAD 和 CT-Transformer 的语音活动检测和文本后处理标点符号模型,这些模块为建立高精度长音频语音识别服务提供了坚实的基础,相较于在公开数据集上训练的其他模型表现更佳。