BriefGPT.xyz
Ask
alpha
关键词
long-range arena benchmark
搜索结果 - 2
EMNLP
线性变换中的魔鬼
本文提出了一种新的线性变压器模型,称为 transNormer,以解决现有线性变压器的性能问题,通过稳定梯度和改善注意力的方式,在文本分类和语言建模任务以及 Long-Range Arena 基准测试中表现出更优异的性能,同时更加高效。
PDF
2 years ago
液体结构状态空间模型
本文介绍了一种新的状态空间结构 Liquid-S4 ,它可以通过对状态转移矩阵的对角线及低秩分解进一步提高序列建模任务的表现,达到了 Long-Range Arena 基准测试的最新水平,并在 Speech Command 识别数据集上实现
→
PDF
2 years ago
Prev
Next