- ICML改进 GFlowNets 使用蒙特卡罗树搜索
我们运用蒙特卡罗树搜索算法(MCTS)提升了生成流网络的规划能力,实验证明这种方法提高了生成流网络的训练样本效率和预先训练模型的生成真实性。
- 基于几何信息的 GFlowNets 用于结构化药物设计
利用生成流网络(GFlowNets)有效地探索药物样分子的组合空间,改进了 GFlowNet 框架,以增强生成特定蛋白质口袋的分子的能力,并通过使用 CrossDocked2020 数据集的实验证明了生成分子与蛋白质口袋之间的结合亲和力的提 - 分叉生成流网络
生成流网络(GFlowNets)是一种有前景的概率抽样框架,目前出现了一种新的家族。然而,现有的 GFlowNets 由于边缘流的直接参数化或依赖于可能难以扩展到大型操作空间的反向策略,往往导致数据效率较低。本文介绍了一种称为 Bifurc - 回顾性反向综合:面向目标条件 GFlowNets 的回顾性反向合成
通过回顾性逆向合成(RBS)方法,我们提出一种应对稀疏奖励问题的新方法,用于训练目标条件下的生成流网络(GFlowNets),并在各类标准评估基准上显著提高样本效率并优于强基准模型。
- 优化 GFlowNets 实现文本到图像扩散对齐
我们提出了 DAG 算法,通过黑盒属性函数对扩散模型进行后训练,从而能够有效地将大规模文本到图像扩散模型与给定的奖励信息对齐。
- 基于生成流网络的无集体变量转移路径采样
通过生成流网络,我们的 TPS-GFN 方法在不依赖 CV 的情况下通过分子轨迹进行能量感知抽样,从而产生比之前的不依赖 CV 的机器学习方法更真实和多样化的转变路径。
- GFlowNet 中的动态回溯:通过奖励依赖调整机制增强决策步骤
利用动态回溯机制进行决策,该论文介绍了一种新颖的 GFlowNet 变种 —— 动态回溯 GFN(DB-GFN),用于生成生化分子和遗传材料序列的生成任务,其中 DB-GFN 在样本质量、探索样本数量和训练收敛速度方面超过现有的 GFlow - 多路径环境中的离散概率推断作为控制
通过在整个马尔可夫决策过程中近似强制执行流的守恒,我们扩展了最近的方法来纠正奖励,以确保最优最大熵强化学习策略引发的边缘分布与原始奖励成比例。
- QGFN: 行动价值的可控贪婪度
通过将 GFN 策略与行为价值估计 Q 相结合,提出了一种新的方法 QGFN,能够在多个任务中生成更多高回报样本而不损失多样性。
- 探索生成流网络的泛化行为
生成流网络(GFlowNets,GFNs)是一种生成式框架,用于学习离散空间上的非归一化概率质量函数。我们通过实证验证了 GFlowNets 的一些泛化机制假设,发现它们学习逼近的函数具有隐含的结构,有利于泛化。同时,我们还发现 GFlow - 演化引导的生成流网络
我们提出了一种名为进化引导生成流网络(EGFN)的方法,通过使用进化算法(EA)对一组代理参数进行训练,将得到的轨迹存储在优先级回放缓冲区中,并使用存储的轨迹训练 GFlowNets 代理,以有效地训练 GFlowNets 模型在处理长轨迹 - 最大熵 GFlowNets 与软 Q 学习
构建适当的奖励函数,建立了生成性流网络(GFN)与最大熵强化学习(RL)之间的确切关系,并介绍了具有最大熵的 GFN。
- 改进基于梯度导引的嵌套抽样用于后验推断
我们提出了一种高性能的通用梯度引导嵌套采样算法 ${t GGNS}$,将可微编程、Hamiltonian 切片采样、聚类、模式分离、动态嵌套采样和并行化的最新技术结合在一起。这种独特组合使 ${t GGNS}$ 在维度上具有良好的可伸缩性, - 双生成流网络
深度学习在药物发现中是一种有效的工具,具有在预测模型和生成模型中的潜在应用。本文介绍了双生成流网络(double GFlowNets,DGFNs),这是一种能够生成多样化候选物分子的方法。通过引入强化学习和双深度 Q 学习的概念,我们在采样 - 生成流网络作为熵正则化强化学习
最近提出的生成流网络(GFlowNets)是一种通过一系列操作,使策略从概率与给定奖励成比例的组合离散对象中采样的方法。我们的工作将强化学习和 GFlowNets 的联系扩展到一般情况,演示了如何将学习生成流网络的任务高效重新定义为具有特定 - PhyloGFN: 基于生成流网络的系统发育推断
采用生成流网络的框架,本文研究在系统发生学中的两个核心问题:基于减少原则和贝叶斯方法的系统发生学推断。通过我们的前向后验采样器,PhyloGFN,我们展示了在真实基准数据集上产生多样化和高质量的进化假设。PhyloGFN 在边缘似然度估计方 - 大型语言模型中的难以计算的推断摊销
通过使用归约化贝叶斯推理方法从难以通过条件概率分布采样的后验分布中提取样本,我们展示了这种分布匹配模型在 LLM 微调中作为最大似然训练和奖励最大化策略优化的有效替代方法,进而实现了对多步骤推理和工具使用任务的数据高效适应。
- 学习能量分解用于 GFlowNets 的部分推理
通过提出的 LED-GFN 模型,该研究论文在五个问题中对生成流网络进行了实证验证,包括无结构和最大独立集的生成,分子图以及 RNA 序列。
- 预训练和微调生成流网络
发展了一种无监督预训练的 GFlowNets 方法,通过预训练 OC-GFN 模型,可以在下游任务中直接提取适应新奖励函数的策略,并证明了该方法在发现模式和适应下游任务方面的有效性。
- 发展中国家程序化环岛生成的概率生成建模
通过马尔可夫决策过程,使用 GFlowNets 作为交通路网生成器实现了将事故道路链接到环形交叉口,比其他相关方法拥有更好的多样性和高有效性得分。