Aug, 2021

大规模差分隐私 BERT

TL;DR本文探究了使用差分隐私 SGD(DP-SGD)进行 BERT-Large 的大规模预训练。通过仔细的实现和批量大小增加,我们提高了 DP-SGD 步骤的实用性,并使用增加的批量大小计划提高了其效率。