May, 2024

DAGER:大型语言模型的精确梯度反转

TL;DRDAGER是一种用于恢复文本数据批的算法,通过利用self-attention层的梯度的低秩结构和标记嵌入的离散性质,以精确的方式恢复整个批次的输入文本数据,用于编码器和解码器架构,并在实验中表现出超过0.99的ROUGE-1/2,速度比之前的攻击快了20倍,并且在可扩展性上可以处理10倍以上的批大小。