BriefGPT.xyz
Ask
alpha
关键词
minimax objective
搜索结果 - 1
基于模型的对抗元强化学习
本文提出了一种基于模型的对抗元强化学习算法 (Model-based Adversarial Meta-Reinforcement Learning),通过最小化所有任务中最劣情况的次优差异 (sub-optimality gap),以及使
→
PDF
4 years ago
Prev
Next