Jan, 2022

Submix: 大规模语言模型的实用私密预测

TL;DR本文介绍了 SubMix,这是一种防止语言模型泄漏私有语料库信息的实用协议,其通过对预测结果进行一定程度的差分隐私处理,限制了个人用户的信息泄露,并保证了语言模型的效用。SubMix 是第一个可以在公开发布成千上万次基于 GPT-2 等大型 transformer 模型的预测结果时仍能维护隐私的协议。