Aug, 2023

Semantify: 使用 CLIP 简化 3D 可变模型的控制

TL;DRSemantify 是一种自监督方法,利用 CLIP 语言 - 视觉基础模型的语义能力来简化对 3D 可塑模型的控制。通过随机抽样模型参数创建训练数据,并计算输出图像与一组词汇描述符之间在 CLIP 潜空间中的相似性,我们通过首先选择一小组语义有意义且脱离的描述符来表征 3DMM,然后学习一个非线性映射从这组描述符的分数到给定 3DMM 的参数系数。这个非线性映射通过训练一个无需人工干预的神经网络来定义。我们展示了在多个 3DMM 上的结果,包括身体形状模型、面部形状和表情模型以及动物形状。演示了我们的方法如何定义一个简单的滑块界面以实现直观建模,并展示了该映射如何将 3D 参数化身体形状立即适配到实际图像。