BriefGPT.xyz
Ask
alpha
关键词
quantization-based approximation
搜索结果 - 1
针对 Q 学习者的战略化策略:控制理论方法
本文研究了 Q-learning 算法(一种经典且广泛应用于强化学习的方法)在游戏中受到复杂对手战略操纵的易感性,并量化了战略上熟练的代理人在了解对手的 Q-learning 算法的情况下可以如何利用一个天真的 Q-learner。为达到这
→
PDF
4 months ago
Prev
Next