BriefGPT.xyz
Ask
alpha
关键词
transformer-like model
搜索结果 - 2
ODformer:基于时空 Transformer 的长序列出行 OD 矩阵预测跨应用场景研究
提出了 ODformer 模型,使用 OD Attention 机制捕捉 OD 对的特殊空间依赖关系,在与 2D-GCN 相结合后大大提高了模型在不同应用方案下的预测能力,并使用 PeriodSparse 自注意力有效预测不同场景下长序列
→
PDF
2 years ago
深度学习方法的句法归纳偏置
我们在本文中介绍了两种归纳偏差方法,分别针对语法结构和依赖关系,实现了深度学习模型的归纳偏差,并通过这些方法建立了深度学习模型的潜在分层表示,使模型能够处理复杂的序列结构并在语言处理任务中取得了优秀的效果。
PDF
2 years ago
Prev
Next