Aug, 2024

MooER:基于大型语言模型的莫尔线程语音识别和翻译模型

TL;DR本研究解决了大型语音识别和翻译模型训练数据不足的问题,提出了一种使用5000小时伪标签数据的新训练策略。MooER模型在评测中表现出色,BLEU得分达到25.2,显示出相较于其他开源模型的优势,具有广泛的应用潜力和研究价值。