BriefGPT.xyz
Ask
alpha
关键词
entropic rl approaches
搜索结果 - 1
生成流网络作为熵正则化强化学习
最近提出的生成流网络(GFlowNets)是一种通过一系列操作,使策略从概率与给定奖励成比例的组合离散对象中采样的方法。我们的工作将强化学习和 GFlowNets 的联系扩展到一般情况,演示了如何将学习生成流网络的任务高效重新定义为具有特定
→
PDF
9 months ago
Prev
Next