Mar, 2023

利用大型文本语料库进行端到端语音摘要

TL;DR本文介绍了两种新颖的方法,利用大量外部文本摘要数据为 E2E SSum 训练提供支持,分别是使用 TTS 系统生成合成语音进行训练,以及使用输入音素序列而非合成语音直接训练模型。实验证明,这些方法在 How2 数据集上改进了多个指标,并且是第一篇使用外部语言资源进行 E2E SSum 的工作。