Mar, 2023
利用大型文本语料库进行端到端语音摘要
Leveraging Large Text Corpora for End-to-End Speech Summarization
Kohei Matsuura, Takanori Ashihara, Takafumi Moriya, Tomohiro Tanaka, Atsunori Ogawa...
TL;DR本文介绍了两种新颖的方法,利用大量外部文本摘要数据为 E2E SSum 训练提供支持,分别是使用 TTS 系统生成合成语音进行训练,以及使用输入音素序列而非合成语音直接训练模型。实验证明,这些方法在 How2 数据集上改进了多个指标,并且是第一篇使用外部语言资源进行 E2E SSum 的工作。