BriefGPT.xyz
大模型
Ask
alpha
关键词
special characteristics
搜索结果 - 1
使用 Transformer 模型对长文本进行建模的调查
本篇论文综述了最新的基于 Transformer 模型的长文本建模技术,其中介绍了长文本模型的定义、如何满足输入长度限制和改进 Transformer 的架构以有效扩展最大上下文长度,以及如何适应长文本的特殊特性。并且描述了长文本建模的四个
→
PDF
a year ago
Prev
Next