关键词continuous state spaces
搜索结果 - 5
- 大型状态空间下的分布鲁棒基于模型的强化学习
提出了一种基于高斯过程和最大方差缩减算法的模型基础方法,用于学习多输出名义转移动力学,克服了强化学习中的若干挑战,并在分布移位方面展示了算法的鲁棒性以及样本数量上的优越性。
- 学习神经符号关系转换模型用于双层规划
本研究提出了一种新型模型 NSRTs,它具有符号和神经组件,在很少的训练次数后就可以用于快速规划,并可以泛化到更多的物体和行为,具有数据高效的特点。
- 无需基准状态的强化学习
提出了一种简单的指示器奖励函数,以解决在连续状态空间中使用强化学习训练策略时无法基于高维观测指定奖励函数的挑战;并提出奖励平衡和奖励过滤两种方法,以进一步加速使用指示器奖励函数的模型的收敛速度,并展示了在无需知道地面实况的情况下从 RGB- - 深度学习中基于 MDP 同态的在线抽象
本论文提出了一种新的算法来找到在具有连续状态空间的环境中的 MDP 抽象,基于 MDP 同态,该算法演示了抽象学习的能力并展示了如何重用这些抽象来引导在新任务中的探索。论文中的任务转移方法在大多数实验中优于基于深度 Q 网络的基准线。
- 使用哈密尔顿动力学的 MCMC
本文介绍了 Hamiltonian Monte Carlo 算法的理论和实践方面,并提出了一些改进,包括使用状态窗口来决定接受或拒绝、使用快速逼近计算轨迹、在轨迹过程中进行调温处理以处理孤立模式和防止无用轨迹占用大量计算时间的快捷方法。