Jul, 2022

BERT 能否预测对比焦点?使用语言模型在神经 TTS 中预测和控制突出显示

TL;DR研究了利用 Transformer 语言模型表示推断文本到语音合成(TTS)中的韵律特征,着重于个人代词的对比焦点预测,采集了一些包含对比焦点的语言数据样本,并使用微调的 BERT 模型预测量化的声学显著性特征,并研究过去的语言数据如何对该预测提供有关信息及如何控制对重要性特征有用。