Oct, 2023

AI 通过不准确的追求权力存在潜在风险的证据回顾

TL;DR人工智能的快速发展引发了专家、决策者和世界领袖的担忧,关于越来越先进的人工智能系统可能造成的存在风险,这篇论文通过研究规范游戏、目标误归纳和寻求权力来审查关于人工智能存在风险的证据。该论文发现目前的证据状况令人担忧但不确定,关于存在极端的不协调寻求权力的可能性。强有力的规范游戏经验证据加上寻求权力的有力概念论证,使得很难排除由于不协调寻求权力而带来的存在风险的可能性。另一方面,迄今为止,还没有公开的关于人工智能系统中不协调寻求权力的实证例子,因此对未来系统将带来存在风险的论点仍然有些推测性质。鉴于目前的证据状况,我们很难非常确信不协调寻求权力存在巨大的存在风险,或者它不构成存在风险。无法有把握地排除人工智能通过不协调寻求权力带来存在风险的事实是令人严重担忧的。