使用可微渲染器学习推断 3D 形状程序
该研究提出了一种基于自下而上的识别系统和结构符号化程序的 3D 形状程序,通过自监督方式对 3D 形状程序进行学习,具有在不同领域中高精度的 3D 形状重建能力,结合图像到 3D 形状模块,能够实现从 RGB 图像直接推断出 3D 形状程序并重建出更加准确和真实的 3D 形状。
Jan, 2019
本文提出了一种面向领域的 3D 形状结构的组装语言 ShapeAssembly, 并训练一个层次顺序 VAE,以从现有形状结构中提取 ShapeAssembly 程序,从而生成可解释和可编辑的 3D 形状。
Sep, 2020
我们提出了 PyTorchGeoNodes,一种可解释的形状程序,用于从图像中重建 3D 对象。我们的实验表明,我们的重建结果与输入场景很好地匹配,并能对重建对象进行语义推理。
Apr, 2024
本文介绍一种用于程序自动合成的方法,通过结合模式识别和显式推理来解决这些复杂的编程问题,同时使用新颖的中间表示和训练算法,使程序合成系统能够自学,从而在简单的英文描述编程问题数据集上取得了最先进的性能表现。
Feb, 2019
ShapeCoder 是第一个可以自动发现并使用抽象化函数来解释给定形状的系统,它使用了形状到程序识别网络和增强的 E 图来发现更好的抽象化函数,并在多个数据集上实现了更好的数据压缩。
May, 2023
本文提出了一种使用通用的不可微分渲染器训练来自 2D 数据的 3D 生成模型的可扩展方法,该方法引入了一个代理神经渲染器来匹配不可微分渲染器的输出。我们进一步提出鉴别器输出匹配以确保神经渲染器学习适当地平滑栅格化。当用纯 2D 图像进行训练时,我们的模型可以比现有模型更好地学习生成更好的 3D 形状。
Feb, 2020
本文研究了细微的物体形态差异在语言中的表达方式,通过图像和三维模型构建了大规模的数据集,利用神经网络进行理解和表达,实现了零样本迁移学习并探究了物体形态与语言结构在物体差异中的关系。
May, 2019
本文介绍了一种从自然图像中学习生成 3D 形状的生成模型的全面无监督方法,其中利用 GAN 等深度学习技术实现,从而生成出真实的三维图像,实现了从二维图像向三维图像的转换。
Oct, 2019
人类对抽象结构的识别和操作能力十分出色,尤其在几何领域中显得更为明显。最近的认知科学研究表明,神经网络并没有共享这种能力,得出结论认为人类的几何能力来自人类心智表示中的离散符号结构。然而,人工智能领域的进展表明,经过标准架构的扩展模型规模和训练数据量后,神经网络开始表现出更类似人类推理的能力。在本研究中,我们重新审视认知科学对几何视觉处理的实证结果,并确定了几何视觉处理中的三个关键偏见:对复杂性、规律性和部分与关系的感知敏感性。我们测试了从文献中探索这些偏见的任务,并发现在人工智能中使用的大型预训练神经网络模型表现出更类似人类的抽象几何处理能力。
Feb, 2024