Apr, 2025

一种领域无关的可扩展AI安全保障框架

TL;DR本研究针对现有AI安全方法通常局限于特定领域的安全条件这一问题,提出了一种新的AI安全框架,该框架能确保AI系统满足用户定义的约束条件,并具有任何所需的概率。通过实验证明,该框架在多个领域中有效,能够在低安全阈值区域内显著优于现有方法,并有效与内部测试数据的规模进行扩展。