Jan, 2022
Submix: 大规模语言模型的实用私密预测
Submix: Practical Private Prediction for Large-Scale Language Models
TL;DR本文介绍了 SubMix,这是一种防止语言模型泄漏私有语料库信息的实用协议,其通过对预测结果进行一定程度的差分隐私处理,限制了个人用户的信息泄露,并保证了语言模型的效用。SubMix 是第一个可以在公开发布成千上万次基于 GPT-2 等大型 transformer 模型的预测结果时仍能维护隐私的协议。