Apr, 2024

BlenderAlchemy:使用视觉语言模型编辑 3D 图形

TL;DR通过利用 Vision-Language Models(像 GPT-4V)智能地搜索设计动作空间,我们提出了一个系统,以满足用户意图的目标,结合了图像生成模型(image-generation models)的 “想象” 参考图像,为抽象语言描述提供视觉基础。该系统在编辑程序材料和 / 或参考图像,以及在复杂场景中调整产品渲染的照明配置等任务中,能够生成简单但繁琐的 Blender 编辑序列。