Nov, 2023

朝着更实用的人工智能安全威胁模型

TL;DR最近的研究发现了人工智能安全领域研究与实践之间存在的差距:学术界研究的威胁并不总是反映了人工智能的实际使用和安全风险。我们的研究是为了描述这种差异的完整程度,并将六种最常研究的人工智能安全攻击威胁模型与实际使用中的人工智能进行匹配。我们发现所有的现有威胁模型确实是适用的,但也存在重大差异:研究常常太宽容于攻击者,并假设实际环境中很少可用的信息。因此,我们的论文呼吁在人工智能安全领域研究更多实用的威胁模型。