BriefGPT.xyz
Ask
alpha
关键词
dager
搜索结果 - 1
DAGER:大型语言模型的精确梯度反转
DAGER 是一种用于恢复文本数据批的算法,通过利用 self-attention 层的梯度的低秩结构和标记嵌入的离散性质,以精确的方式恢复整个批次的输入文本数据,用于编码器和解码器架构,并在实验中表现出超过 0.99 的 ROUGE-1/
→
PDF
a month ago
Prev
Next