- 机器遗忘中的威胁、攻击与防御:一项综述
机器去学习的关键概念、影响因素和机制的综述,提供对威胁和防御的分类、方法和解决方案的建议,以促进未来研究和实际应用的发展。
- 人工临床记录的零样本和少样本生成策略
使用零样本和少样本提示策略,本研究评估了 Llama 2 LLM 创建合成医疗记录的能力,将其与需要敏感患者数据进行训练的精调方法进行比较,结果显示这种连贯思维提示方法允许零样本模型在 Rouge 评估指标上达到与精调模型相当的结果。
- SoK:联邦反学习的挑战与机遇
这篇论文从事一项关于联邦消除学习(federated unlearning)的研究,通过对已发表的联邦学习消除(FL unlearning)相关论文的分类和分析,探讨了联邦学习消除领域的研究趋势和挑战,比较了现有联邦学习消除方法的影响消除和 - 多任务面部(MTF)数据集:用于多种分类任务的合法和道德合规的面部图像收集
通过公开可用的名人图像,严格遵守版权规定,我们以 MTF 图像数据集为基础,基于深度学习模型提出了多任务人脸数据集,用于进行人脸识别、性别、年龄和种族分类研究,与数据的原始获取和处理进行性能比较并提供基准线。
- 使用矩阵配置文件进行时间序列合成的匿名化
通过基于矩阵剖面(Matrix Profile)的时间序列综合方法(TSSUMP),我们可以合成时间序列以替代原始数据,从而解决由于隐私规定或机密商业信息泄漏的难题,并保持合成时间序列与原始时间序列之间的相似连接信息(Matrix Prof - 去往何处即是你的身份 —— 基于机器学习的语义隐私攻击研究
机器学习和位置数据的隐私攻击对隐私造成了显著风险,并且需要隐私监管来保护个人的位置信息。
- 上下文中的遗忘:语言模型作为少样本遗忘器
提出了一种称为 “In-Context Unlearning” 的 LLM 的反学习方法,通过在推理时提供具有翻转标签和额外正确标记的实例作为输入,有效地从训练集中删除特定信息,同时保持与最先进的反学习方法相媲美甚至超过其性能水平。
- 高效机器遗忘的随机重标记
提出了一种机器去学习的方案,针对个人隐私数据撤销和相关数据管理条例提出了高效机制,随机重标记的未学习方案适用于通用的监督学习算法,并且进一步开发了一种基于概率分布相似性、较少限制的删除认证方法,这种方法基于逻辑回归分类器。
- 推荐算法遗忘
本论文提出了 RecEraser,一种针对推荐任务的通用,高效的机器遗忘框架,该框架将培训集分为多个分片,并为每个分片训练一个组成模型。通过三种新颖的数据分区算法将培训数据分成基于它们相似性的平衡组,然后提出一种自适应聚合方法来提高全局模型 - 零样本机器遗忘
本論文提出了一個名為 Zero-shot 機器學習的新問題,探討如何從 MOD 交易所中刪除特定集合或類別的數據,介紹一種基於誤差最小化最大化噪音和門控知識傳遞的解決方案,實驗結果在基準視覺數據集上展示了良好的效果。
- 面向公益的信用评分: 基于智能手机的微型贷款提升金融普惠
提出了一种通过构建假社交网络并使用复杂的网络分析与表示学习来改进智能手机应用中的信用评分模型,以实现增强金融包容,提高全球金融福祉的方法。
- 通过对抗信念匹配实现零样本知识迁移
通过使用对抗生成器训练学生模型,从而在没有任何数据或元数据的情况下,将来自大型教师网络的知识迁移到小型学生网络中,实现了零数据的跨数据集知识迁移,并在少样本下获得了比实际数据集的更好效果。