BriefGPT.xyz
大模型
Ask
alpha
关键词
model detection
搜索结果 - 4
利用激活优化检测特洛伊模型
本文提出了一种基于激活优化的机器学习预训练模型特征提取方法,并训练分类器来检测 Trojan 模型,该方法在两个公开数据集上达到了最先进的性能。
PDF
a year ago
ICLR
使用可扩展的指纹技术负责任披露生成模型
研究人员开发出一种称为指纹技术的机制,该技术旨在检测并追溯深度生成模型的使用,以防止其被用于创建深度伪造和传播虚假信息。
PDF
4 years ago
放射性数据:追踪训练
使用无法感知的放射性数据技术可以检测出数据集对模型的训练;该技术提供了更高的信噪比,也更为鲁棒。
PDF
4 years ago
利用元神经分析检测 AI 木马
本文提出了 Meta Neural Trojan Detection (MNTD) 管道来解决机器学习特洛伊木马攻击检测的挑战,通过训练一个能够预测目标模型是否被特洛伊木马攻击的元分类器来检测黑盒模型,同时引入 jumbo learning
→
PDF
5 years ago
Prev
Next