BriefGPT.xyz
Ask
alpha
关键词
safe constraint reward framework
搜索结果 - 1
Safe CoR: 用约束性回报集成模仿学习和安全强化学习的双专家方法
在自主机器人领域,确保复杂和动态环境下的安全性和可靠性仍然是一个重大挑战。通过引入安全约束,安全强化学习解决这些问题,但在复杂驾驶环境等复杂环境中仍面临挑战。为了应对这些挑战,我们提出了安全约束奖励(Safe CoR)框架,这是一种利用两种
→
PDF
23 days ago
Prev
Next