BriefGPT.xyz
Ask
alpha
关键词
safety margins
搜索结果 - 1
强化学习的安全裕度
任何自主控制器在某些情况下都可能不安全,定量识别这些不安全情况的能力对于及时引起人类监督至关重要。本研究展示了真正危急情况的临界性可以被鲁棒地定义为随机行动导致的奖励减少的平均值。可以将实时计算的代理临界性度量与真正的临界性进行比较,并展示
→
PDF
a year ago
Prev
Next