BriefGPT.xyz
Ask
alpha
关键词
classic games
搜索结果 - 1
基于 Q 的均衡
本文研究了一类基于 Q 学习的策略规则,在不同的监控技术下,寻找平衡偏差以及如何将偏好修正到 Q 值中,以实现更有效的合作和均衡策略。
PDF
a year ago
Prev
Next