关键词visual content creation
搜索结果 - 3
- 图像任意:朝着始终合理推理和无需训练的多模态图像生成
ImgAny 是一种新颖的端到端多模态生成模型,可以模仿人类推理并生成高质量图像。该方法能够有效且灵活地接收来自语言、音频和视觉等七种不同的模态组合,并通过实体融合分支和属性融合分支整合多个输入模态,并利用预训练的稳定扩散模型生成图像。大量 - 3D 感知图像合成综述
介绍了近年来深度学习实现的视觉内容创作方法的显著进展,包括 3D 感知生成图像合成,旨在提供一个关于 3D 感知图像合成的综述,为相关领域的研究工作提供有用的参考,并通过我们的讨论部分激发未来的研究方向。
- 3D 照片风格化:从单张图像学习生成风格化新视角
本文提出了一个深度模型,在场景的点云表示中学习基于几何感知的内容特征,以生成高质量且在视图上具有一致性的艺术化图像,从而实现了从单个图像到任意风格化图像的 3D 照片艺术化生成,并在定性和定量研究中展示了方法的优越性。