DreamCreature: 从想象中创造逼真的虚拟生物

Nov, 2023

DreamCreature: 从想象中创造逼真的虚拟生物

DreamCreature: Crafting Photorealistic Virtual Creatures from Imagination

Kam Woh Ng, Xiatian Zhu, Yi-Zhe Song, Tao Xiang

TL;DR通过利用未标记图像和无监督方法，DreamCreature提出了一种新的文本生成图像模型，能够生成具有丰富结构和逼真外观的新生物种类，以促进创意应用和属性修改。

Abstract

Recent text-to-image (T2I) generative models allow for high-quality synthesis following either text instructions or visual examples. Despite their capabilities, these models face limitations in creating new, detailed creatures within specific categories (e.g., virtual dog or bird species), which are valuable in digital asset creation and biodiversity analysi

发现论文，激发创造

视觉想象的生成模型

本文使用变分自动编码器来实现以视觉为基础的想象，并提出了新的训练目标和推理网络，并提出了可衡量视觉想象的分别代表正确性，覆盖率和组合性的评价指标，最后通过将方法应用于两种数据集进行详细比较。

May, 2017

DreamBooth3D: 基于主题的文本到三维生成

DreamBooth3D是一种将个性化的文本-图像模型与文本-3D生成相结合的方法，通过3阶段优化策略实现了神经光辐射场的3D一致性和文本-图像模型的个性化能力，能够生成高质量、个性化的3D模型。

Mar, 2023

从自然语言到可验证图像生成的视觉属性转移

本研究提出一种自然语言到有效图像生成（NL2VI）的方法，将自然提示转换为更适合图像生成的可视提示。通过实验，将自然提示与图像生成对齐可以提高生成图像的一致性，尤其在烹饪和DIY等领域具有广泛的推广和应用。

May, 2023

文本到图像生成的培育实践

这篇研究论文探讨了人工智能生成图像的创作方式以及弊端，如训练数据的偏见、合成数据常态化可能导致未来图像生成系统的质量下降，以及文本生成图像对人们想象力、抱负和发展的潜在长期影响。

Jun, 2023

抽象概念的文本到图像生成

通过利用三层艺术理论的建议，我们提出了一种用于抽象概念的文本到图像生成的框架，该框架通过将抽象概念转化为明确的意图、从 LLMs 中提取的语义相关的物体和依赖于概念的形式来生成图像。人类评估结果和我们设计的概念评分指标的评价结果证明了我们的框架在表达抽象概念方面的有效性。

Sep, 2023

想象无形的世界：一个对视觉世界模型中系统化泛化的基准

系统化视觉想象技巧的第一个基准测试（SVIB）引入了一种最小化世界建模问题的新框架，通过评估模型在潜在世界动态下生成一步图像到图像转换的能力，为我们带来了系统感知和想象的联合优化、多个难度等级和控制训练中使用的因子组合的可能性。我们对SVIB上的各种基线模型进行了全面评估，提供了系统化视觉想象技巧的最新发展现状的见解，希望该基准测试有助于推进视觉系统化组合性的发展。

Nov, 2023

使用DreamGaussian探索生成真实的濒危物种3D模型的可行性：高度角对模型生成的影响分析

有限的数据条件下，研究了使用生成对抗网络生成濒危物种3D模型的可行性，探讨了海拔角度对生成结果的质量的影响，旨在促进人工智能在保护濒危动物方面的应用。

Dec, 2023

虚拟宠物：在3D场景中生成可动物体

通过Virtual Pet管道，我们介绍了一种解锁生成模型在沉浸式4D体验中潜力的方法，用于在3D环境中为目标动物物种建模真实多样的动作。通过利用单眼互联网视频并提取可变形NeRF表示前景和静态NeRF表示背景来规避与环境几何对齐的3D动作数据的有限可用性。我们展示了我们的管道的有效性，使用猫视频进行了全面的定性和定量评估，并表明在未见过的猫和室内环境中也具有多样性，为丰富的虚拟体验产生了时间上连续的4D输出。

Dec, 2023

现实与幻想的构建：LLM辅助提示解释的现场生成

通过扩展扩散模型，本研究通过Realistic-Fantasy网络（RFNet）提供了一种无需训练的方法，从而解决了在处理复杂和富有想象力的提示时的局限性，并结合了艺术创造力和现实-幻想场景。

Jul, 2024

梦兽：通过部件感知知识转移蒸馏3D幻想动物

本研究针对现有的3D幻想动物生成方法中的部件语义理解不足问题，提出了一种新颖的DreamBeast方法。该方法通过部件感知知识转移机制，有效利用Stable Diffusion 3模型提取部件知识，从而快速生成多视角的3D动物资产，显著提高了生成质量，并降低了计算开销。

Sep, 2024