May, 2024

DAGER:大型语言模型的精确梯度反转

TL;DRDAGER 是一种用于恢复文本数据批的算法,通过利用 self-attention 层的梯度的低秩结构和标记嵌入的离散性质,以精确的方式恢复整个批次的输入文本数据,用于编码器和解码器架构,并在实验中表现出超过 0.99 的 ROUGE-1/2,速度比之前的攻击快了 20 倍,并且在可扩展性上可以处理 10 倍以上的批大小。