BriefGPT.xyz
Ask
alpha
关键词
aegis
搜索结果 - 2
AEGIS: 在线自适应 AI 内容安全审查与 LLM 专家集成
使用人工智能生成模型,我们定义了一个广泛的内容安全风险分类法,同时创建了一个新的数据集 AEGISSAFETYDATASET,用于研究和评估大型语言模型的安全性能。通过实验表明,我们提出的模型 AEGISSAFETYEXPERTS 不仅在多
→
PDF
3 months ago
IJCAI
Aegis: 针对垂直联邦学习的可信、自动和准确的验证框架
本研究提出了 Aegis,一种值得信赖的自动和准确的验证框架,用于垂直联邦学习的安全验证。它能够检测出 95% 的威胁模型,并在总共 VFL 作业时间的 84%内提供细粒度的验证结果。
PDF
3 years ago
Prev
Next