通过区分概率程序设计感知难题
这篇论文介绍了一个基于概率编程和计算机图形学的方法来解决计算机视觉中的图形逆问题,提出了一种简洁的概率图形程序来定义灵活的生成模型,并自动反演真实世界图像以诠释它们。
Jun, 2013
研究解决学习特定领域语言中表达的可微分函数的问题,通过将神经网络的不同类视为对程序空间的松弛,并在一系列分类任务中实例化遗传算法和分支界限搜索来发现自然解释和有竞争力的程序分类器。
Jul, 2020
本研究提出了一种更符合人类感知理解与合理推理的可分析且可微分的执行器,用以辅助 3D 形状图程序的生成,并在无人知道真实程序的情况下达到更高的样本效率。初步实验表明,该研究为构建能够学习和推理人类认知知识的机器提供了有益的探索。
Jun, 2022
我们提出了一种基于组合程序转换的方法,用于支持概率编程语言中的变分推断,该方法能够灵活地处理多个关键问题,包括自动微分、密度累积、跟踪和无偏梯度估计策略。此外,相比于现有的支持变分推断的概率编程语言,我们的设计在用户定义的目标、梯度估计策略和模型、变分族类别方面具有更高的表达能力。
Jun, 2024
通过 Visual Program Distillation (VPD) 框架将大型语言模型 (LLM) 的理解能力提炼到一个具备单次前向传递解决复杂视觉任务的视觉 - 语言模型 (VLM) 上,从而改善计数、理解空间关系和组合推理等能力,并在真实世界的应用(有限数据情况下的内容管理)中得到验证。
Dec, 2023
本书介绍了概率编程的基础和技术,主要包括概率编程语言的设计和构建、基础推理算法和高阶概率编程语言、概率编程与可微分编程的交叉应用,尤其是深度概率编程系统的设计与语言特性对其的影响。
Sep, 2018
通过使用不同的可微编程语言和神经网络的框架,我们创建了端到端可训练系统,可以学习编写带感知元素的可解释算法。通过模块化结构和归纳偏差,我们证明了可以学习一组不断增长和改进的 (神经) 函数库,这可以带来比基线更高效的新任务知识传递。
Nov, 2016
我们探讨了计算生成特殊 “质数” 图像的问题,当这些图像在某种特定的物理排列和视角下观察时,它们会产生光学幻觉。我们提出了这个问题的一个正式定义,并引入了 Diffusion Illusions,这是第一个全面的流水线,旨在自动生成各种这些幻觉。我们研究了三种类型的幻觉,其中以不同的方式排列质数图像,并使用上述损失进行优化,使其衍生的图像与用户选择的文本提示或图像对齐。我们在这些幻觉上进行了全面的实验,从定性和定量上验证了我们提出的方法的有效性。此外,我们还展示了我们的幻觉成功进行的物理制作 - 因为它们都是为在现实世界中工作而设计的。
Dec, 2023
通过大规模模型、海量数据集、加速硬件和可微分编程的变革力量,人工智能最近取得了显著进展。不仅可以以端到端的方式对复杂计算机程序进行微分,还可以优化程序参数。可微分编程建立在自动微分、图模型、优化和统计学等多个计算机科学和应用数学领域的基础上,本书全面评估了不同 iable 编程的基本概念。通过优化和概率的两个主要视角,我们介绍了两者之间的明显相似之处。可微分编程不仅仅是程序的微分,还包括为微分而设计的富有思考的程序,通过使程序可微分,我们自然引入了与程序输出相关的概率分布,从而提供了量化不确定性的手段。
Mar, 2024