Mar, 2024

注意力拼接:注意力如何解决语音编辑问题

TL;DR借助预训练的文本到语音模型,AttentionStitch 通过在其之上加入双重注意力块网络,自动将合成的梅尔频谱图与编辑文本的梅尔频谱图进行无缝融合,从而实现了高质量的语音编辑。