BriefGPT.xyz
Ask
alpha
关键词
longt5
搜索结果 - 2
mLongT5:针对更长序列的多语言高效文本转换器
本文介绍了我们关于开发一种适用于处理长输入的多语言高效文本到文本转换器的工作,称为 mLongT5 (即在 LongT5 架构上构建并利用用于预训练 mT5 和 UL2 预训练任务的多语言数据集),我们评估了该模型在各种多语言摘要和问答任务
→
PDF
a year ago
ACL
LongT5: 高效的长序列文本转换器
本文介绍了一种新模型 LongT5,该模型将长输入变换(ETC)的注意力机制和摘要预训练(PEGASUS)的预训练策略整合到可扩展的 T5 架构中,取得了更好的自然语言摘要和问答系统结果。
PDF
3 years ago
Prev
Next