Apr, 2023

基于 Q 的均衡

TL;DR本文研究了一类基于 Q 学习的策略规则,在不同的监控技术下,寻找平衡偏差以及如何将偏好修正到 Q 值中,以实现更有效的合作和均衡策略。