Jul, 2024

通过令牌操作保护分类器中的隐私

TL;DR通过文本操作的水平,我们研究了使用语言模型作为远程服务时可能避免数据暴露的前景。我们聚焦于文本分类模型,检查各种令牌映射和上下文操作函数,以确定在保持原始文本不可恢复的同时能否保持分类器准确性。我们发现,尽管有些令牌映射函数容易实现,但它们对下游任务的性能有很大影响,并且通过一个复杂的攻击者可以重建。相比之下,上下文操作提供了性能的改进。