BriefGPT.xyz
Ask
alpha
关键词
robust planning
搜索结果 - 2
人机协作的强韧机器人规划
本研究提出了一种基于马尔可夫决策模型的方法,针对人与机器人合作中存在的不确定性,自动推导出可能的人类行为策略,并提出了一种基于部分可观察的马尔可夫决策过程的机器人计划算法。实验结果表明该方法可实现合作任务的稳定性和高效性。
PDF
a year ago
生命周期强化学习中的可扩展和鲁棒计划的最小价值等价部分模型
本文提出了新的模型,称为 “最小价值等效部分模型”,它只对环境的相关方面进行建模。通过实验证明,基于此类模型的规划方法具有可伸缩性和鲁棒性。
PDF
a year ago
Prev
Next