BriefGPT.xyz
Feb, 2025
大型语言模型中的偏斜记忆:量化与分解
Skewed Memorization in Large Language Models: Quantification and Decomposition
HTML
PDF
Hao Li, Di Huang, Ziyu Wang, Amir M. Rahmani
TL;DR
本研究针对大型语言模型(LLMs)中的记忆现象,揭示了其可能带来的隐私和安全风险。通过分析记忆与训练时长、数据集规模和样本间相似性的关系,提出了新颖的量化方法,并为降低风险提供了理论与实证支持,促进了对隐私保护的深入理解。
Abstract
Memorization
in
Large Language Models
(LLMs) poses
Privacy
and
Security
→