utility preservation | BriefGPT

关键词utility preservation

搜索结果 - 5

大型语言模型中的软提示对取消学习的影响
通过在训练数据的子集上实现遗忘的相对较轻量级替代方案，我们的研究框架 SPUL 能够显著改善使用 LLMs 进行文本分类时效用和遗忘之间的平衡。
PDF19 days ago
大规模语言模型的全面高效后编程安全对齐
我们提出了一种后安全对齐（PSA）方法，以解决目前大型语言模型（LLMs）中脆弱和不平衡的安全机制问题，并且能够提升安全性、减轻过度安全性，并在保持实用性的同时无缝集成到目标 LLM 中。实验表明，这种方法不仅实现了比基准方法更全面和高效的
PDFa month ago
Inf2Guard: 一个信息理论框架用于学习抵抗判断攻击的隐私保护表示
机器学习中存在多种推断攻击，现有防御方法要么只针对特定类型的攻击且损失很大，要么很快被自适应攻击突破。本研究提出了一种信息理论防御框架 Inf2Guard，用于对抗推断攻击。该框架通过学习共享表示来保护隐私和保留效用，并展示了多种优势及对现
PDF4 months ago
PII 之生命：PII 混淆变压器
本文提出了 “Life of PII”—— 一种新颖的基于 Transformer 框架的 PII 伪装转换器来保护敏感个人身份信息的隐私，此方法比传统的数据扰动技术更加有效，具有更大的隐私保护和数据实用性之间的灵活性并提供了真实世界应用所
PDFa year ago
ICML一种用于脸部模糊化的保护实用性 GAN
本文提出了一种称为 UP-GAN 的实用性保持生成模型，它在提供有效的面部隐私保护的同时，保留了年龄、性别、肤色、姿势和表情等面部特征。我们展示了该方法在面部隐私保护和实用性保护方面取得了最佳表现。
PDF5 years ago