BriefGPT.xyz
Ask
alpha
关键词
sparse reward problem
搜索结果 - 2
回顾性反向综合:面向目标条件 GFlowNets 的回顾性反向合成
通过回顾性逆向合成(RBS)方法,我们提出一种应对稀疏奖励问题的新方法,用于训练目标条件下的生成流网络(GFlowNets),并在各类标准评估基准上显著提高样本效率并优于强基准模型。
PDF
a month ago
基于合作图的多智能体稀疏奖励强化学习方法
本文提出了一种基于 Cooperation Graph 结构的 Multiagent Reinforcement Learning(CG-MARL)算法,通过设计一个网络结构来有效处理多智能体领域中的稀疏奖励问题,并在实验中展示出全面领先的
→
PDF
2 years ago
Prev
Next