BriefGPT.xyz
大模型
Ask
alpha
关键词
partially observable environment
搜索结果 - 3
张量再生核希尔伯特空间中的安全强化学习
本文探讨了在部分可观察环境下的安全强化学习问题,旨在实现安全可达性目标。通过提出一种基于随机模型的方法,在面对未知系统动态和部分观测环境时,几乎确定地保证了强化学习的安全性。利用预测状态表示和再生核希尔伯特空间,对未来的多步观测进行了解析表
→
PDF
7 months ago
基于时序逻辑奖励塑形的强化学习分布式控制
本文提出了一个基于计算框架的分布式控制策略合成方法,用于处理存在部分观测的异质机器人团队,旨在满足 Truncated Linear Temporal Logic(TLTL)规范,其方法将综合问题表述为一个随机博弈,并采用策略图方法为每个机
→
PDF
2 years ago
ICML
部分观测环境下模型参数的学徒学习
通过推断专家演示背后的行动选择过程,学习具有一定不确定性的部分可观测环境中的任务,可以更准确地估计 POMDP 参数并从短暂演示中获得更好的策略,与仅从环境反应学习的方法相比更为有效。
PDF
12 years ago
Prev
Next