BriefGPT.xyz
大模型
Ask
alpha
关键词
vision-and-language generation
搜索结果 - 2
MiniGPT-5:基于生成 Vokens 的交叉视觉与语言生成
分阶段训练方法和生成 vokens 提高大型语言模型在视觉和语言生成方面的效果。
PDF
9 months ago
ACL
DU-VLG:通过双序列预训练统一视觉和语言生成
本论文提出了一种名为 DU-VLG 的框架,该框架将视觉和语言生成视为序列生成问题,并通过双向生成,利用对图像和文本的成对处理。采用多模态降噪自编码器任务和模态翻译任务进行双重预训练,并设计了一种新的承诺损失方法,以提高图像生成的质量。研究
→
PDF
2 years ago
Prev
Next