Jan, 2022

AI 安全中的临界性概念

TL;DR本文提出了一种更有效的解决AI安全中的价值同步问题的解决方案,其方法是利用关键指标来测量动作的重要性,只在关键动作时需要操作者进行干预,操作者在处理其他工作时也能保证安全。