BriefGPT.xyz
Ask
alpha
关键词
threatened markov decision processes
搜索结果 - 1
AAAI
面临威胁的强化学习
本文介绍了一种面向对抗环境的 Markov 决策过程(TMDPs)框架,提出了 level-k 思考策略,并通过实验验证了在考虑敌手因素的情况下学习模型的好处。
PDF
6 years ago
Prev
Next