Mar, 2024

学习推断视觉概念的生成模板程序

TL;DR从少数示例中抓取灵活的视觉概念。我们探索了一种神经符号系统,该系统学习如何推断以通用方式捕捉视觉概念的程序。我们引入了模板程序:来自特定领域语言的程序表达式,用于指定输入概念中的结构和参数模式。我们的框架支持多个与概念相关的任务,包括通过解析进行少数示例生成和共分割。我们开发了一种学习范式,使我们能够从包含概念分组的视觉数据集中直接训练推断模板程序的网络。我们在多个视觉领域进行实验:2D 布局,Omniglot 字符和 3D 形状。我们发现我们的方法优于特定任务的替代方案,并在存在有限领域特定方法的领域中表现出有竞争力。