BriefGPT.xyz
大模型
Ask
alpha
关键词
q-learning algorithms
搜索结果 - 3
视觉强化学习中无界数据增强的配方
通过数据增强的广义方法 SADA,可以提高 Q - 学习算法在视觉观察训练中的稳定性和泛化能力,适用于各种数据增强方式。
PDF
a month ago
高空卫星通信网络中的小区切换:流量负载的不可见性如何影响决策
通过引入 HAPS 辅助网络中的基站切换方法中的小区负载估计问题,本研究旨在解决基站切换决策中的负载估计问题,以提高能量效率。研究表明,估计误差可以改变切换决策,并导致性能差异。此外,开发的 Q 学习算法表现良好,与最优算法之间仅有微小差异
→
PDF
2 months ago
随机团队与博弈的去中心化 Q-Learning
本文介绍了用于随机动态团队和游戏的分散 Q 学习算法,研究了其在包括团队问题在内的弱无环情况下的收敛性。
PDF
9 years ago
Prev
Next