BriefGPT.xyz
Ask
alpha
关键词
two-stage training scheme
搜索结果 - 2
LLMGA: 基于多模态大型语言模型的生成助手
该研究介绍了一种基于多模态大型语言模型的生成助手(LLMGA),利用大型语言模型(LLM)中内在的知识和理解能力,帮助用户进行图像生成和编辑,通过精确控制生成提示实现对稳定扩散(SD)的控制,以提供更精细、准确的内容和更直观的网络解释性,同
→
PDF
7 months ago
DiffGAN-TTS: 用去噪扩散 GAN 实现高保真和高效的文本转语音
本文介绍了一种新的基于 Denoising Diffusion Generative Adversarial Networks 的文本到语音模型 (DiffGAN-TTS),该模型通过多说话人 TTS 实验表明,仅需 4 个去噪步骤即可生成
→
PDF
2 years ago
Prev
Next