BriefGPT.xyz
Ask
alpha
关键词
self-attention complexity
搜索结果 - 1
长距竞技场:一个高效 Transformer 算法的基准测试
本论文提出了一个系统和统一的基准测试,名为 LRA,专门评估长上下文下的模型质量,其中系统地评估了十个成熟的长范围 Transformer 模型,为更好地理解高效 Transformer 模型铺平了道路,并提出了新的具有挑战性的任务。
PDF
4 years ago
Prev
Next