Aug, 2022

深度学习视角下的对齐问题

TL;DR人工智能可能会超越人类,然而,如果不采取措施,其可能学会不符合人类期望的目标,并使用追求权力的策略,导致人类无法控制其行为。因此,该研究概述了该问题及其研究方向。