BriefGPT.xyz
大模型
Ask
alpha
关键词
visual synthesis
搜索结果 - 6
OpFlowTalker:通过光流引导实现逼真自然的说话人脸生成
通过应用光流来指导面部图像生成,增强帧与帧之间的连续性和语义一致性,这篇论文提出了一种名为 “OpFlowTalker” 的新方法,利用音频输入预测的光流变化而非直接预测图像,平滑图像的过渡并使其与语义内容相吻合,通过序列融合技术替代单帧的
→
PDF
a month ago
负责任的视觉编辑
本研究探索了将有害图像转化为负责任的图像的新任务,并提出了一种名为 Cognitive Editor 的模型,通过两个认知阶段的过程来提高其性能。研究还创建了一个名为 AltBear 的数据集,用泰迪熊代替人类来表达有害信息。实验结果表明,
→
PDF
3 months ago
StrokeNUWA: 笔画分词用于矢量图形合成
使用矢量图像进行视觉综合可以提高语义表示的真实性,本文引入 StrokeNUWA 作为一种更好的视觉表示,通过矢量图像上的 “笔画标记” 实现了高度压缩,提高了速度,并在向量图形生成任务中明显优于传统的 LLMs 和基于优化的方法。
PDF
5 months ago
增强潜在扩散与流匹配
通过将流匹配引入扩散模型和卷积解码器之间,结合扩散模型的多样性、流匹配的高效性和卷积解码器的有效性,我们实现了最先进的高分辨率图像合成。
PDF
7 months ago
NÜWA: 神经视觉世界创造的视觉综合预训练
本文提出了一种名为 N'UWA 的统一的多模态预训练模型,可以生成新的或调节现有的视觉数据(即图像和视频)以进行各种视觉合成任务。N'UWA 在 8 个下游任务上的表现超过了强基准,并且在文本到图像生成,文本到视频生成,视频预测等任务上实现
→
PDF
3 years ago
生成网络的潜空间优化
本文介绍了生成对抗网络的成功因素,并提出 “生成潜在优化” 框架来训练深度卷积生成器,实现了可视化合成、样本插值等功能,同时不需要对抗优化方案。
PDF
7 years ago
Prev
Next