Sep, 2024

强化学习的临界性与安全边际

TL;DR本研究针对传统强化学习方法在某些情况下可能遇到的不安全情况,提出了一种既有可量化的标准真值又易于用户理解的临界性框架。通过引入实际临界性和代理临界性,我们发现,监督5%的决策可以潜在地避免近一半的错误,为自动化系统的调试和监督提供了新的思路。