- 将对称性融入 GFlowNets 中
本研究旨在通过在生成过程中识别等效动作,将对称性整合到 GFlowNets 中。使用合成数据的实验结果显示了我们提出方法的良好性能。
- ICML尴尬地并行化的 GFlowNets
GFlowNets 以及其拆分并行版本 EP-GFlowNet 是用于离散复合随机变量的一种有前景的 MCMC 采样替代方法,旨在解决后先验采样中的困难和分布在客户端的数据间的通信问题。
- 分叉生成流网络
生成流网络(GFlowNets)是一种有前景的概率抽样框架,目前出现了一种新的家族。然而,现有的 GFlowNets 由于边缘流的直接参数化或依赖于可能难以扩展到大型操作空间的反向策略,往往导致数据效率较低。本文介绍了一种称为 Bifurc - 回顾性反向综合:面向目标条件 GFlowNets 的回顾性反向合成
通过回顾性逆向合成(RBS)方法,我们提出一种应对稀疏奖励问题的新方法,用于训练目标条件下的生成流网络(GFlowNets),并在各类标准评估基准上显著提高样本效率并优于强基准模型。
- GFlowNet 中的动态回溯:通过奖励依赖调整机制增强决策步骤
利用动态回溯机制进行决策,该论文介绍了一种新颖的 GFlowNet 变种 —— 动态回溯 GFN(DB-GFN),用于生成生化分子和遗传材料序列的生成任务,其中 DB-GFN 在样本质量、探索样本数量和训练收敛速度方面超过现有的 GFlow - 用 GFlowNets 进行组合优化的蚁群抽样
该论文介绍了一种新型的神经引导元启发式算法,Generative Flow Ant Colony Sampler (GFACS),用于组合优化。该算法将生成流网络 (GFlowNets) 与蚁群优化 (ACO) 方法相结合,在组合空间中提供 - 探索生成流网络的泛化行为
生成流网络(GFlowNets,GFNs)是一种生成式框架,用于学习离散空间上的非归一化概率质量函数。我们通过实证验证了 GFlowNets 的一些泛化机制假设,发现它们学习逼近的函数具有隐含的结构,有利于泛化。同时,我们还发现 GFlow - 演化引导的生成流网络
我们提出了一种名为进化引导生成流网络(EGFN)的方法,通过使用进化算法(EA)对一组代理参数进行训练,将得到的轨迹存储在优先级回放缓冲区中,并使用存储的轨迹训练 GFlowNets 代理,以有效地训练 GFlowNets 模型在处理长轨迹 - AAAI非循环生成流网络的理论
GFlowNets 是一种新型的基于流的方法,用于学习通过一系列动作以及与给定正向奖励成比例的概率来生成对象的随机策略。我们在放宽应用范围的前提下对 GFlowNets 的假设进行了改进,特别是解除了关于非环性的限制。为此,我们扩展了可测空 - 学习能量分解用于 GFlowNets 的部分推理
通过提出的 LED-GFN 模型,该研究论文在五个问题中对生成流网络进行了实证验证,包括无结构和最大独立集的生成,分子图以及 RNA 序列。
- 预训练和微调生成流网络
发展了一种无监督预训练的 GFlowNets 方法,通过预训练 OC-GFN 模型,可以在下游任务中直接提取适应新奖励函数的策略,并证明了该方法在发现模式和适应下游任务方面的有效性。
- 学习为温度有条件的 GFlowNets 缩放逻辑
GFlowNets 是一种概率模型,通过学习随机策略来生成组合结构,如分子图。我们提出了一种名为 LSL-GFN 的新颖架构,通过学习将温度作为输入来加速训练 temperature-conditional GFlowNets,并在多个生物 - 局部搜索 GFlowNets
通过使用局部搜索方法来培训 GFlowNets,本文解决了传统 GFlowNet 方法在产生高回报样本方面的困难,进而表现出出色的性能提升。
- ICML使用回放缓冲区对 GFlowNets 模式探索有效性的实证研究
本文研究了在 GFlowNets 算法中应用 replay buffer 的效果,结果表明相较于仅使用生成的轨迹,使用 replay buffer 训练可以提高模式发现的速度和质量。
- ICMLDownstream Treatment 效应估计的贝叶斯因果探索方法基准测试
通过实施强大的评估程序,我们评估了六种现有的基线因果关系发现方法和一种基于 GFlowNets 的新方法,用于治疗效果估计,并提供了有价值的洞察力,考虑了合成和真实世界场景以及低数据场景。此外,我们研究的结果表明,GFlowNets 能够有 - GFlowNets 多阶段主动学习
本文提出采用 GFlowNets 多保真度主动学习算法,可在具有多个保真度和代价参差不齐的神奇黑匣子函数的情况下,高效加速科学发现和工程设计。
- 具有个性化的元生成流网络用于任务特定的适应性
本文提出了 pGFlowMeta 算法,结合了任务特定的个性化策略与元策略,并在稀疏奖励和异质性环节上实现了性能提升,理论分析表明其算法收敛速度是次线性的,而广泛的实验表明所提出的算法在离散环境中优于现有的强化学习算法。
- 使用基于流的解释方法揭示 GNNs 模型的洞见
本研究提出了一种叫做 XInsight 的解释性算法来生成图神经网络的模型解释,以便在高风险应用中(例如药物发现)识别错误并发现新知识。通过对 MUTAG 数据集和一个合成数据集进行实验,证明了 XInsight 的实用性,并且 XInsi - 让流动告诉我们答案:使用 GFlowNets 解决图形组合优化问题
本文提出了利用 GFlowNets 与 Markov 决策过程相结合的方法,通过训练条件 GFlowNets 来采样解空间,并通过各种合成数据和真实数据模拟多种不同的组合问题。通过大量实验证明,GFlowNet 策略可以高效地找到高质量解。
- GFlowNets 与人类反馈
提出了使用人类反馈的 GFlowNets 框架来提高 AI 模型训练的探索能力,使用人类对不同轨迹的评估拟合奖励函数,目标是学习一个严格按照人类评级比例的策略,而非仅关注人类喜爱评级的 RLHF,实验证明 GFlowHF 比 RLHF 的探