BriefGPT.xyz
大模型
Ask
alpha
关键词
autoregressive training
搜索结果 - 2
语音增强的语言建模用于文本到语音合成
我们提出了一种声学增强的语言建模方法,通过使用语音单元预测中的错误积累来改善 TTS 模型的性能,通过自我监督表示来作为自回归语言模型的训练目标,并采用非自回归模型来预测包含细粒度声学细节的离散声学编解码器,以减少非自回归训练中的错误传播,
→
PDF
a month ago
多模态生成预训练
本文介绍了 Emu—— 一种基于 Transformer 的多模态基础模型,它可以在多模态语境中无缝生成图像和文本。该模型可通过单一模型进行全自回归训练,将任何单模态或多模态数据输入混合 (例如,交错的图像、文本和视频),并表现得十分出色。
PDF
a year ago
Prev
Next