BriefGPT.xyz
大模型
Ask
alpha
关键词
lin-confident-ftrl
搜索结果 - 1
独立功能逼近的强化学习与马尔可夫博弈:在局部访问模型下改进的样本复杂度界限
学习大状态和动作空间中的均衡、克服多项机构所带来的麻烦是一个具有挑战性的问题,最近的研究尝试通过使用独立的线性函数类来逼近每个代理的边际 Q 值来解决这个问题。我们介绍了一种新算法 Lin-Confident-FTRL,用于学习具有本地对模
→
PDF
4 months ago
Prev
Next