BriefGPT.xyz
Ask
alpha
关键词
hard-constraint satisfaction guarantee
搜索结果 - 1
基于已知约束函数的多能源管理系统安全强化学习
本文提出了两种新的安全强化学习方法,即 SafeFallback 和 GiveSafe,其安全约束公式与 RL 公式分离,可提供硬约束满足保证,且无需解决数学问题,从而降低计算能力要求,并具有更灵活的约束公式表述。方法可应用于超出 RL 的
→
PDF
2 years ago
Prev
Next