DreamCreature: 从想象中创造逼真的虚拟生物
本文使用变分自动编码器来实现以视觉为基础的想象,并提出了新的训练目标和推理网络,并提出了可衡量视觉想象的分别代表正确性,覆盖率和组合性的评价指标,最后通过将方法应用于两种数据集进行详细比较。
May, 2017
DreamBooth3D是一种将个性化的文本-图像模型与文本-3D生成相结合的方法,通过3阶段优化策略实现了神经光辐射场的3D一致性和文本-图像模型的个性化能力,能够生成高质量、个性化的3D模型。
Mar, 2023
本研究提出一种自然语言到有效图像生成(NL2VI)的方法,将自然提示转换为更适合图像生成的可视提示。通过实验,将自然提示与图像生成对齐可以提高生成图像的一致性,尤其在烹饪和DIY等领域具有广泛的推广和应用。
May, 2023
这篇研究论文探讨了人工智能生成图像的创作方式以及弊端,如训练数据的偏见、合成数据常态化可能导致未来图像生成系统的质量下降,以及文本生成图像对人们想象力、抱负和发展的潜在长期影响。
Jun, 2023
通过利用三层艺术理论的建议,我们提出了一种用于抽象概念的文本到图像生成的框架,该框架通过将抽象概念转化为明确的意图、从 LLMs 中提取的语义相关的物体和依赖于概念的形式来生成图像。人类评估结果和我们设计的概念评分指标的评价结果证明了我们的框架在表达抽象概念方面的有效性。
Sep, 2023
系统化视觉想象技巧的第一个基准测试(SVIB)引入了一种最小化世界建模问题的新框架,通过评估模型在潜在世界动态下生成一步图像到图像转换的能力,为我们带来了系统感知和想象的联合优化、多个难度等级和控制训练中使用的因子组合的可能性。我们对SVIB上的各种基线模型进行了全面评估,提供了系统化视觉想象技巧的最新发展现状的见解,希望该基准测试有助于推进视觉系统化组合性的发展。
Nov, 2023
有限的数据条件下,研究了使用生成对抗网络生成濒危物种3D模型的可行性,探讨了海拔角度对生成结果的质量的影响,旨在促进人工智能在保护濒危动物方面的应用。
Dec, 2023
通过Virtual Pet管道,我们介绍了一种解锁生成模型在沉浸式4D体验中潜力的方法,用于在3D环境中为目标动物物种建模真实多样的动作。通过利用单眼互联网视频并提取可变形NeRF表示前景和静态NeRF表示背景来规避与环境几何对齐的3D动作数据的有限可用性。我们展示了我们的管道的有效性,使用猫视频进行了全面的定性和定量评估,并表明在未见过的猫和室内环境中也具有多样性,为丰富的虚拟体验产生了时间上连续的4D输出。
Dec, 2023
通过扩展扩散模型,本研究通过Realistic-Fantasy网络(RFNet)提供了一种无需训练的方法,从而解决了在处理复杂和富有想象力的提示时的局限性,并结合了艺术创造力和现实-幻想场景。
Jul, 2024
本研究针对现有的3D幻想动物生成方法中的部件语义理解不足问题,提出了一种新颖的DreamBeast方法。该方法通过部件感知知识转移机制,有效利用Stable Diffusion 3模型提取部件知识,从而快速生成多视角的3D动物资产,显著提高了生成质量,并降低了计算开销。
Sep, 2024