Oct, 2022

目标错误泛化:为什么正确的规范并不足以达成正确的目标

TL;DR该研究主要讨论 AI 系统可能在追求不期而至的目标时出现的问题,如规定游戏和目标误化,并提出几个研究方向以减少这些问题带来的灾难风险。