BriefGPT.xyz
Ask
alpha
关键词
token sequence
搜索结果 - 3
DAGER:大型语言模型的精确梯度反转
DAGER 是一种用于恢复文本数据批的算法,通过利用 self-attention 层的梯度的低秩结构和标记嵌入的离散性质,以精确的方式恢复整个批次的输入文本数据,用于编码器和解码器架构,并在实验中表现出超过 0.99 的 ROUGE-1/
→
PDF
a month ago
TEAL: 多模态大型语言模型的令牌化和嵌入全部
使用 TEAL 方法,将来自任何模态的输入处理为一个记号序列,学习所有模态的联合嵌入空间,并通过联合嵌入空间使得多模态的大型语言模型能够在涉及非文本模态的理解和生成任务中执行,如图像和音频。
PDF
8 months ago
预训练序列到序列和显著性模型的结合抽象化摘要
本研究通过实验证明,将能够识别源文本重要部分的显著性模型与预先训练的 seq-to-seq 模型相结合,可以在 CNN/DM 和 XSum 数据集上优于预先训练的 seq-to-seq 模型,并在 ROUGE-L 指标上超过以前最佳表现模型
→
PDF
4 years ago
Prev
Next