BriefGPT.xyz
Ask
alpha
关键词
categorical approaches
搜索结果 - 1
一种具有生成模型的近似最小最大优化的分布式强化学习
我们提出了一种新的算法,用于基于模型的分销式强化学习,经证明在逼近具有生成模型的回报分布方面是极小极大最优的(在对数因子上),解决了张等人(2023 年)的一个悬而未决的问题。我们的分析为分销式强化学习的类别方法提供了新的理论结果,并引入了
→
PDF
5 months ago
Prev
Next