BriefGPT.xyz
Ask
alpha
关键词
metaformers
搜索结果 - 2
分层联想记忆、并行化 MLP-Mixer 和对称性破坏
通过将 Krotov 的分层关联记忆与 MetaFormers 相结合,该论文提出了一种新的视角,将整个 Transformer 块的完整表示,包括标记 -/ 通道混合模块、层归一化和跳跃连接,作为一个单一的 Hopfield 网络。该方法
→
PDF
18 days ago
OpenSTL: 时空预测学习的综合基准测试
本文提出了 OpenSTL,这是深度学习领域中,一个比较全面的基准测试,用于对空间 - 时间预测学习方法进行分类和评估,鲜见较为系统的研究,论文还对时序模型和数据集因素进行了详细分析,并提出了一种可提高空间 - 时间预测学习性能的通用 Me
→
PDF
a year ago
Prev
Next