visual synthesis | BriefGPT

关键词visual synthesis

搜索结果 - 6

OpFlowTalker：通过光流引导实现逼真自然的说话人脸生成
通过应用光流来指导面部图像生成，增强帧与帧之间的连续性和语义一致性，这篇论文提出了一种名为 “OpFlowTalker” 的新方法，利用音频输入预测的光流变化而非直接预测图像，平滑图像的过渡并使其与语义内容相吻合，通过序列融合技术替代单帧的
PDFa month ago
负责任的视觉编辑
本研究探索了将有害图像转化为负责任的图像的新任务，并提出了一种名为 Cognitive Editor 的模型，通过两个认知阶段的过程来提高其性能。研究还创建了一个名为 AltBear 的数据集，用泰迪熊代替人类来表达有害信息。实验结果表明，
PDF3 months ago
StrokeNUWA: 笔画分词用于矢量图形合成
使用矢量图像进行视觉综合可以提高语义表示的真实性，本文引入 StrokeNUWA 作为一种更好的视觉表示，通过矢量图像上的 “笔画标记” 实现了高度压缩，提高了速度，并在向量图形生成任务中明显优于传统的 LLMs 和基于优化的方法。
PDF5 months ago
增强潜在扩散与流匹配
通过将流匹配引入扩散模型和卷积解码器之间，结合扩散模型的多样性、流匹配的高效性和卷积解码器的有效性，我们实现了最先进的高分辨率图像合成。
PDF7 months ago
NÜWA: 神经视觉世界创造的视觉综合预训练
本文提出了一种名为 N'UWA 的统一的多模态预训练模型，可以生成新的或调节现有的视觉数据（即图像和视频）以进行各种视觉合成任务。N'UWA 在 8 个下游任务上的表现超过了强基准，并且在文本到图像生成，文本到视频生成，视频预测等任务上实现
PDF3 years ago
生成网络的潜空间优化
本文介绍了生成对抗网络的成功因素，并提出 “生成潜在优化” 框架来训练深度卷积生成器，实现了可视化合成、样本插值等功能，同时不需要对抗优化方案。
PDF7 years ago