Feb, 2024

使用嵌入翻译进行模型配对,检测开放集分类任务中的后门攻击

TL;DR我们提出了一种使用模型对开放集分类任务的技术来检测后门攻击,该技术可以在不同体系结构、独立训练且使用不同数据集的模型中检测到后门攻击,并通过线性操作比较嵌入向量并计算相似度得分。