Jul, 2023

通过数据生成和强化学习提升标点恢复

TL;DR这篇研究论文提出了一种强化学习方法,利用主题相关的书面文本和最新的大规模预训练生成式语言模型,来填补自动语音识别中书面文本和语音识别文本之间的差距,并在标点恢复的两个基准数据集上取得了最先进的性能。