Mar, 2024

AI 评估与红队行动的安全港湾

TL;DR对生成式人工智能系统进行独立评估和红队测试对于识别风险至关重要,但主要人工智能公司用于阻止模型滥用的服务条款和执法策略对善意安全评估存在不利因素,因此一些研究人员担心进行此类研究或公开发现将导致账户暂停或法律报复。我们提议重要人工智能开发者承诺提供法律和技术的 “安全港”,为公共利益的安全研究提供保障,免于账户暂停或法律报复的威胁。我们相信这些承诺是朝着更具包容性和顺畅的社区合作努力,解决生成式人工智能的风险问题所需的必要步骤。