Oct, 2023

PrIeD-KIE:面向隐私保护的文件关键信息提取

TL;DR通过差分隐私、联邦学习和差分隐私联邦学习的大型预训练文档基础模型,我们介绍了开发私有键信息提取(KIE)系统的策略。通过在六个基准数据集上的广泛实验,我们证明了大型文档基础模型可以在私有环境下进行有效微调,以实现足够的性能并保持强大的隐私保证。最后,我们引入了一种名为 FeAm-DP 的新型 DP-FL 算法,它能够将全局差分隐私从独立环境有效地扩展到多客户联邦环境。总体而言,我们的研究为私有 KIE 系统的开发提供了宝贵的见解,并凸显了文档基础模型在隐私保护文档 AI 应用中的潜力。