将对称性融入 GFlowNets 中

Jun, 2024

Baking Symmetry into GFlowNets

George Ma, Emmanuel Bengio, Yoshua Bengio, Dinghuai Zhang

TL;DR本研究旨在通过在生成过程中识别等效动作，将对称性整合到 GFlowNets 中。使用合成数据的实验结果显示了我们提出方法的良好性能。

Abstract

gflownets have exhibited promising performance in generating diverse candidates with high rewards. These networks generate objects incrementally and aim to learn a policy that assigns probability of sampling objects in proportion to rewards. However, the current training pipelines of <

gflownets isomorphic actions symmetry reward diversity

发现论文，激发创造

轨迹平衡：GFlowNets 中改进的信用分配

该文研究了生成流网络中的学习策略，提出了一种更有效的学习目标 - trajectory balance，并在实验中验证了其提高生成样本多样性和网络收敛性的效果。

Jan, 2022

基于流网络的生成模型用于非迭代多样候选生成

本文提出了一种基于 GFlowNet 的生成策略来生成对象的方法，该方法将生成过程视为一种流动网络，并将一组轨迹转换为流动，并将流动一致性方程转换为学习目标，以实现训练时的搜索成本，从而提高了性能和多样性。

Jun, 2021

非循环生成流网络的理论

GFlowNets 是一种新型的基于流的方法，用于学习通过一系列动作以及与给定正向奖励成比例的概率来生成对象的随机策略。我们在放宽应用范围的前提下对 GFlowNets 的假设进行了改进，特别是解除了关于非环性的限制。为此，我们扩展了可测空间上的 GFlowNets 理论，其中包括了没有循环限制的连续状态空间，并在这个广义上下文中提供了循环的一般化。我们展示了迄今为止使用的损失函数会使流陷入循环，因此我们定义了一族能解决这个问题的损失函数。在图形和连续任务上进行的实验证实了这些原则。

Dec, 2023

探究与改进 GFlowNet 的训练

本文介绍了基于 GFlowNets 算法的生成模型策略，探究了如何在实际训练资源限制下实现更好的样本效率和匹配目标分布，提出了优先回放、相对边流策略参数化和新的引导轨迹平衡目标等方法来提高样本效率，有效解决了一些结构学分配问题。

May, 2023

分叉生成流网络

生成流网络（GFlowNets）是一种有前景的概率抽样框架，目前出现了一种新的家族。然而，现有的 GFlowNets 由于边缘流的直接参数化或依赖于可能难以扩展到大型操作空间的反向策略，往往导致数据效率较低。本文介绍了一种称为 Bifurcated GFlowNets（BN）的新方法，该方法采用分岔结构设计，将流程分解成状态流程和基于边缘的流程分配的独立表示。此分解使得 BN 能够更有效地从数据中学习，并更好地处理大规模问题，同时保持收敛保证。通过在标准评估基准上进行了大量实验，我们证明 BN 相对于强基准模型显著提高了学习效率和效果。

Jun, 2024

回顾性反向综合：面向目标条件 GFlowNets 的回顾性反向合成

通过回顾性逆向合成（RBS）方法，我们提出一种应对稀疏奖励问题的新方法，用于训练目标条件下的生成流网络（GFlowNets），并在各类标准评估基准上显著提高样本效率并优于强基准模型。

Jun, 2024

等变流：对称密度的精确似然生成学习

本文研究了等变正规化流，在物理和化学的多体系统中存在的对称性被设计地融入流中，建立流的基础块并提高采样效率与泛化能力。

Jun, 2020

局部搜索 GFlowNets

通过使用局部搜索方法来培训 GFlowNets，本文解决了传统 GFlowNet 方法在产生高回报样本方面的困难，进而表现出出色的性能提升。

Oct, 2023

随机环境下的预期流网络与两人零和游戏

生成流网络（GFlowNets）在多个结构化对象生成任务中取得成功，并扩展到包括蛋白质设计在内的随机环境，提出了预期流网络（EFlowNets）和对抗性流网络（AFlowNets）分别用于两人零和游戏，表明后者在 Connect 4 比赛中通过自对弈发现超过 80% 的最优移动，并超越 AlphaZero。

Oct, 2023

Thompson 采样在 GFlowNets 中的应用提高探索性能

本文提出了一种基于多臂赌博机思想的贝叶斯技术算法（TS-GFN），将训练过程中的轨迹选择视为主动学习问题，从学习策略的近似后验分布中采样轨迹来提高探索效率，进而比过去的离线探索策略更快地收敛至目标分布，在两个领域的实验中证明了其优越性。

Jun, 2023