Feb, 2020
量子纠缠数字水印抵御模型抽取攻击
Entangled Watermarks as a Defense against Model Extraction
Hengrui Jia, Christopher A. Choquette-Choo, Varun Chandrasekaran, Nicolas Papernot
TL;DR本文提出一种名为 EWE 的恒定水印嵌入技术,该技术将水印紧密嵌入到训练任务中,促使模型同时学习正常输入和此类水印,并在测试时表现优异,可实现在 100 次以下查询成功地断言模型属于自己。