BriefGPT.xyz
Ask
alpha
关键词
forward models
搜索结果 - 2
系统辨识中的强化学习
该论文探讨了在强化学习领域中,如何通过学习前向模型(也称转移函数、系统动力学)来近似马尔可夫决策过程中状态转移函数的过程,并提出了利用强化学习技术解决复杂动态系统学习问题的实验结果
PDF
2 years ago
基于模型的离散和连续行动规划
本文介绍了一种使用前向模型的行动计划方法,在离散动作空间中通过反向传播实现规划,使用参数化的动作向量和输入噪声,同时使用策略蒸馏方法,性能优于模型自由 RL 和离散计划方法,可以应用于离散和连续动作空间的模型控制任务。
PDF
7 years ago
Prev
Next