Dec, 2023

最大熵 GFlowNets 与软 Q 学习

TL;DR构建适当的奖励函数,建立了生成性流网络(GFN)与最大熵强化学习(RL)之间的确切关系,并介绍了具有最大熵的 GFN。