有序保留的 GFlowNets

Sep, 2023

Order-Preserving GFlowNets

Yihang Chen, Lukas Mauch

TL;DROrder-Preserving GFlowNets (OP-GFNs) are proposed to sample candidates in proportion to a learned reward function consistent with a given order, eliminating the need for a predefined scalar reward in tasks like multi-objective optimization, and it is proven to concentrate on higher hierarchy candidates, achieving state-of-the-art performance in various tasks.

Abstract

generative flow networks (GFlowNets) have been introduced as a method to sample a diverse set of candidates with probabilities proportional to a given reward. However, GFlowNets can only be used with a predefined scalar reward, which can be either computationally expensive or not direc

generative flow networks order-preserving gflownets reward function multi-objective optimization pareto front approximation

发现论文，激发创造

预训练和微调生成流网络

发展了一种无监督预训练的 GFlowNets 方法，通过预训练 OC-GFN 模型，可以在下游任务中直接提取适应新奖励函数的策略，并证明了该方法在发现模式和适应下游任务方面的有效性。

Oct, 2023

探究与改进 GFlowNet 的训练

本文介绍了基于 GFlowNets 算法的生成模型策略，探究了如何在实际训练资源限制下实现更好的样本效率和匹配目标分布，提出了优先回放、相对边流策略参数化和新的引导轨迹平衡目标等方法来提高样本效率，有效解决了一些结构学分配问题。

May, 2023

局部搜索 GFlowNets

通过使用局部搜索方法来培训 GFlowNets，本文解决了传统 GFlowNet 方法在产生高回报样本方面的困难，进而表现出出色的性能提升。

Oct, 2023

演化引导的生成流网络

我们提出了一种名为进化引导生成流网络（EGFN）的方法，通过使用进化算法（EA）对一组代理参数进行训练，将得到的轨迹存储在优先级回放缓冲区中，并使用存储的轨迹训练 GFlowNets 代理，以有效地训练 GFlowNets 模型在处理长轨迹和稀疏奖励时的挑战。通过广泛的玩具和真实世界基准任务的深入研究，我们展示了我们的方法在处理长轨迹和稀疏奖励时的有效性。

Feb, 2024

探索生成流网络的泛化行为

生成流网络（GFlowNets，GFNs）是一种生成式框架，用于学习离散空间上的非归一化概率质量函数。我们通过实证验证了 GFlowNets 的一些泛化机制假设，发现它们学习逼近的函数具有隐含的结构，有利于泛化。同时，我们还发现 GFlowNets 对离线和离策略训练非常敏感，但是 GFlowNets 隐含学习到的奖励对训练分布的变化具有鲁棒性。

Feb, 2024

QGFN: 行动价值的可控贪婪度

通过将 GFN 策略与行为价值估计 Q 相结合，提出了一种新的方法 QGFN，能够在多个任务中生成更多高回报样本而不损失多样性。

Feb, 2024

基于生成流网络的精确奖励导向图模型主动学习

本文提出了基于生成式流网络的图主动学习问题的创新形式：GFlowGNN。我们提出了流节点和流特征的概念，以便有效地将图建模为基于流的生成流网络。并在实际数据集上进行了广泛的实验，证明了该方法具有良好的探索能力和可转移性，表现优于各种最先进的方法。

Apr, 2023

基因引导的 GFlowNets：提升实用分子优化基准

本篇论文提出了一种新的 GFlowNet 变体，遗传引导 GFlowNet (Genetic GFN)，通过将迭代遗传搜索集成到 GFlowNet 中，有效地指导 GFlowNet 到高回报区域，解决全局过度探索导致训练效率低下和探索有限区域的问题。此方法在实际分子优化 (PMO) 的基准测试中达到了 16.213 的最高分数，明显优于报道的最佳分数 15.185，超过了 23 个任务中的所有基准线，包括强化学习、贝叶斯优化、生成模型、GFlowNets 和遗传算法。

Feb, 2024

最大熵 GFlowNets 与软 Q 学习

构建适当的奖励函数，建立了生成性流网络（GFN）与最大熵强化学习（RL）之间的确切关系，并介绍了具有最大熵的 GFN。

Dec, 2023

生成流网络作为熵正则化强化学习

最近提出的生成流网络（GFlowNets）是一种通过一系列操作，使策略从概率与给定奖励成比例的组合离散对象中采样的方法。我们的工作将强化学习和 GFlowNets 的联系扩展到一般情况，演示了如何将学习生成流网络的任务高效重新定义为具有特定奖励和正则化结构的熵正则化强化学习问题，并通过在几个概率建模任务上应用标准的软强化学习算法展示了这种改进的实际效率。与先前报告的结果相反，我们表明熵正则化强化学习方法可以与已建立的 GFlowNet 训练方法竞争。这一观点为将强化学习原理整合到生成流网络领域开辟了直接道路。

Oct, 2023