使用可微渲染器学习推断 3D 形状程序

Jun, 2022

使用可微渲染器学习推断 3D 形状程序

Learning to Infer 3D Shape Programs with Differentiable Renderer

Yichao Liang

TL;DR本研究提出了一种更符合人类感知理解与合理推理的可分析且可微分的执行器，用以辅助 3D 形状图程序的生成，并在无人知道真实程序的情况下达到更高的样本效率。初步实验表明，该研究为构建能够学习和推理人类认知知识的机器提供了有益的探索。

Abstract

Given everyday artifacts, such as tables and chairs, humans recognize high-level regularities within them, such as the symmetries of a table, the repetition of its legs, while possessing low-level priors of their geometries, e.g., surfaces are smooth and edges are sharp. This kind of knowledge constitutes an important part of human →

perceptual understanding 3d shape programs neural generator executor sample efficiency

发现论文，激发创造

学习推断和执行三维形状程序

该研究提出了一种基于自下而上的识别系统和结构符号化程序的 3D 形状程序，通过自监督方式对 3D 形状程序进行学习，具有在不同领域中高精度的 3D 形状重建能力，结合图像到 3D 形状模块，能够实现从 RGB 图像直接推断出 3D 形状程序并重建出更加准确和真实的 3D 形状。

Jan, 2019

ShapeAssembly: 学习生成三维形状结构合成程序

本文提出了一种面向领域的 3D 形状结构的组装语言 ShapeAssembly，并训练一个层次顺序 VAE，以从现有形状结构中提取 ShapeAssembly 程序，从而生成可解释和可编辑的 3D 形状。

Sep, 2020

PyTorchGeoNodes：用于三维形状重建的可微分形状程序

我们提出了 PyTorchGeoNodes，一种可解释的形状程序，用于从图像中重建 3D 对象。我们的实验表明，我们的重建结果与输入场景很好地匹配，并能对重建对象进行语义推理。

Apr, 2024

学习推理程序草图

本文介绍一种用于程序自动合成的方法，通过结合模式识别和显式推理来解决这些复杂的编程问题，同时使用新颖的中间表示和训练算法，使程序合成系统能够自学，从而在简单的英文描述编程问题数据集上取得了最先进的性能表现。

Feb, 2019

ShapeCoder: 从非结构化基元中发现视觉程序的抽象

ShapeCoder 是第一个可以自动发现并使用抽象化函数来解释给定形状的系统，它使用了形状到程序识别网络和增强的 E 图来发现更好的抽象化函数，并在多个数据集上实现了更好的数据压缩。

May, 2023

逆向图形生成对抗网络：从非结构化 2D 数据生成 3D 形状的学习

本文提出了一种使用通用的不可微分渲染器训练来自 2D 数据的 3D 生成模型的可扩展方法，该方法引入了一个代理神经渲染器来匹配不可微分渲染器的输出。我们进一步提出鉴别器输出匹配以确保神经渲染器学习适当地平滑栅格化。当用纯 2D 图像进行训练时，我们的模型可以比现有模型更好地学习生成更好的 3D 形状。

Feb, 2020

ShapeGlot: 学习形状区分的语言

本文研究了细微的物体形态差异在语言中的表达方式，通过图像和三维模型构建了大规模的数据集，利用神经网络进行理解和表达，实现了零样本迁移学习并探究了物体形态与语言结构在物体差异中的关系。

May, 2019

自然图像中的无监督生成式三维形状学习

本文介绍了一种从自然图像中学习生成 3D 形状的生成模型的全面无监督方法，其中利用 GAN 等深度学习技术实现，从而生成出真实的三维图像，实现了从二维图像向三维图像的转换。

Oct, 2019

大规模预训练神经网络中的人类化几何抽象

人类对抽象结构的识别和操作能力十分出色，尤其在几何领域中显得更为明显。最近的认知科学研究表明，神经网络并没有共享这种能力，得出结论认为人类的几何能力来自人类心智表示中的离散符号结构。然而，人工智能领域的进展表明，经过标准架构的扩展模型规模和训练数据量后，神经网络开始表现出更类似人类推理的能力。在本研究中，我们重新审视认知科学对几何视觉处理的实证结果，并确定了几何视觉处理中的三个关键偏见：对复杂性、规律性和部分与关系的感知敏感性。我们测试了从文献中探索这些偏见的任务，并发现在人工智能中使用的大型预训练神经网络模型表现出更类似人类的抽象几何处理能力。

Feb, 2024

学习可微分逻辑程序以进行抽象视觉推理

提出了基于神经 - 符号融合的可微转移学习推理机制，命名为 NEUMANN，并通过推理识别复杂的可视化场景，包括因果推理和抽象概念推理。

Jul, 2023