- 发展中国家程序化环岛生成的概率生成建模
通过马尔可夫决策过程,使用 GFlowNets 作为交通路网生成器实现了将事故道路链接到环形交叉口,比其他相关方法拥有更好的多样性和高有效性得分。
- 随机环境下的预期流网络与两人零和游戏
生成流网络(GFlowNets)在多个结构化对象生成任务中取得成功,并扩展到包括蛋白质设计在内的随机环境,提出了预期流网络(EFlowNets)和对抗性流网络(AFlowNets)分别用于两人零和游戏,表明后者在 Connect 4 比赛中 - 局部搜索 GFlowNets
通过使用局部搜索方法来培训 GFlowNets,本文解决了传统 GFlowNet 方法在产生高回报样本方面的困难,进而表现出出色的性能提升。
- 扩散生成流采样器:通过部分轨迹优化改善学习信号
我们提出了一种基于扩散生成流采样器 (DGFS) 的抽样框架,该方法可以将学习过程易于处理地分解为短的部分轨迹段,通过参数化额外的 “流函数”,并且在各种具有挑战性的实验中展示了相比于相关先前方法更准确的规范常量估计。
- Delta-AI:稀疏图模型中的摊销推理的局部目标
通过稀疏概率图模型中的摊销推理算法,我们能够基于策略学习对象的局部属性生成适用于脱机训练的局部损失,从而有效地提取感兴趣的边缘和条件分布,并对稀疏因子结构的潜变量模型进行训练。
- 有序保留的 GFlowNets
Order-Preserving GFlowNets (OP-GFNs) are proposed to sample candidates in proportion to a learned reward function consis - 人机循环因果发现在潜在混杂下的祖先 GFlowNets
借助生成流网络,利用原始信念分布比例对因果祖先图进行采样,然后通过层次变量间关系的有力实验设计,迭代地与专家互动,有效减少对因果祖先图的不确定性。通过重要性采样结合人的反馈,更新我们的样本,提高推理质量,并不需要因果充足(即可能存在未观察到 - 生成流网络:马尔可夫链角度
本文对 Generative Flow Networks 进行了形式化,并将其视为循环马尔科夫链状态空间下采样的一种方法,这一方法可以在不使用流动的情况下模拟复杂的多模态概率分布函数。
- ICMLThompson 采样在 GFlowNets 中的应用提高探索性能
本文提出了一种基于多臂赌博机思想的贝叶斯技术算法(TS-GFN),将训练过程中的轨迹选择视为主动学习问题,从学习策略的近似后验分布中采样轨迹来提高探索效率,进而比过去的离线探索策略更快地收敛至目标分布,在两个领域的实验中证明了其优越性。
- ICMLBatchGFN: 批量主动学习的生成流网络
BatchGFN 使用生成流网络来采样比例为批量奖励的数据点集,可构建高度信息化批次用于主动学习,在玩具回归问题中,通过适当的奖励函数以单次前向通过批次中的每个点,取样接近最优效用批次,最大化批次奖励的贪婪近似已不再需要。同时,我们还提出了 - 使用单一生成流网络进行图形结构与参数的联合贝叶斯推断
该研究论文提出了一种名为 JSP-GFN 的新方法,该方法使用一个生成流网络对贝叶斯网络结构和条件概率分布的参数进行共同后验分布近似,以适用于非线性模型,并在模拟和真实数据上进行验证。
- torchgfn:PyTorch GFlowNet 库
介绍了一个名为 torchgfn 的基于 PyTorch 的库,旨在为生成流网络提供一个简单的 API 和有用的抽象,并通过在一系列常见环境和损失函数上进行训练,通过提供多个示例来解决不同代码库之间的差异问题。
- ICML探究与改进 GFlowNet 的训练
本文介绍了基于 GFlowNets 算法的生成模型策略,探究了如何在实际训练资源限制下实现更好的样本效率和匹配目标分布,提出了优先回放、相对边流策略参数化和新的引导轨迹平衡目标等方法来提高样本效率,有效解决了一些结构学分配问题。
- 基于生成流网络的广义通用域自适应
本文介绍了一种新的无监督领域适应问题,广义通用领域适应(GUDA),旨在实现对包括未知类别在内的所有目标标签的精确预测。为解决此问题,我们利用生成流网络的强大探索能力,提出了一种名为 GFlowDA 的主动领域适应算法,该算法选择的样本与奖 - 基于生成流网络的精确奖励导向图模型主动学习
本文提出了基于生成式流网络的图主动学习问题的创新形式:GFlowGNN。我们提出了流节点和流特征的概念,以便有效地将图建模为基于流的生成流网络。 并在实际数据集上进行了广泛的实验,证明了该方法具有良好的探索能力和可转移性,表现优于各种最先进 - 分布式 GFlowNets 与分位数流
本文提出了一种名为 Quantile Matching 的新型 GFlowNet 学习算法,它采用了分布法来处理代理的激励波动性,并且对具有决定性的激励任务也有显著的改进。
- 基于能量的 GFlowNets 一致性训练用于建模离散联合分布
本研究基于联合能量模型,提出了一个名为 JEBGFNs 的模型,用于生成多个变量的离散对象。通过对抗性奖励,结合 GFlowNet 模型训练参数,此模型在生成抗菌肽方面的性能得到了显著改善,并在发现抗菌肽的主动学习设置中得到了评估。
- GFlowOut: 基于生成性流网络的 Dropout
本研究旨在提出一种名为 GFlowOut 的方法,利用生成性流网络(GFlowNets)的概率框架来学习丢弃掩码的后验分布,并解决用传统变分推断方法来估算高度多模式后验分布及利用样本相关信息的困难,最终实验证明 GFlowOut 的预测分布 - 神经符号因果推理遇到信令博弈的新型语义交流模式
提出了一种新的基于信号博弈和神经符号人工智能方法的新兴语义通信系统框架,用于因果推理,最终实现高效的通信和更好的语义可靠性。
- GFlowCausal: 用于因果发现的生成式流网络
提出了一种名为 GFlowCausal 的新方法,通过逐步添加直接边将图搜索问题转变为生成问题,从而从观测数据中学习一个有向无环图 (DAG),并使用基于可传递闭包的即插即用模块确保高效的采样,理论分析表明,此模块能够有效地保证无环特性和最