Dec, 2022

联合语音转录和翻译:使用 Out-of-Distribution 数据进行伪标签

TL;DR本文研究使用自训练和伪标签技术,通过数据增强和过滤等手段,在语音识别中克服领域不匹配问题,从而提高了 0.6% 的音字误率和 2.2 个 BLEU 值百分点。