Nov, 2023

谋划中的人工智能:AIs是否会在训练过程中假装对齐以获取权力?

TL;DR通过对高级人工智能(AI)进行训练是否会导致后期谋取权力的行为进行检查,研究报告得出结论认为谋划是使用基线机器学习方法训练目标导向的高级AI以谋取权力的一种令人担心的可能结果,而进行训练是谋取权力的一种良好策略,研究报告提出了进一步探索该主题的一系列经验研究方向。