BriefGPT.xyz
大模型
Ask
alpha
关键词
generative sequence-to-sequence tasks
搜索结果 - 1
Longformer:长文档转换器
Longformer 是一种基于 Transformers 的模型,采用能够线性缩放序列长度的自注意力机制,使得处理数千个记号以上的文档变得容易;与先前的一些工作不同的是,Longformer 同时进行了预训练和下游任务的微调,并在 Wik
→
PDF
4 years ago
Prev
Next