BriefGPT.xyz
Ask
alpha
关键词
option discovery
搜索结果 - 2
使用因子图为基础的表格强化学习中学习多智能体选项
本文提出了一种基于 Kronecker 图的多智能体协同探索的选项发现方法,通过鼓励智能体连接相应的最小或最大 Fiedler 向量,构建多智能体共同目标状态,从而在多智能体任务中实现更快的探索和更高的累积奖励。
PDF
2 years ago
ICML
强化学习中的选项发现拉普拉斯框架
本文介绍了如何通过引入特征奇异目的 (intrinsic reward functions) 从学习过后的 PVFs 中隐式定义选项来解决选项发现问题,从而在强化学习中同时解决了表示学习和选项发现两大难题。
PDF
7 years ago
Prev
Next