BriefGPT.xyz
Ask
alpha
关键词
efficient attention
搜索结果 - 2
具有线性复杂度的交互式多头自注意力
我们通过分解提出了一种高效的多头自注意力交互方法,该方法通过建立注意力矩阵中的跨头交互来增强信息流动,并将注意力操作分解成查询和无键组件,以降低注意力矩阵的维度,从而实现更高效的注意力操作。实验结果表明,所提出的跨头交互方法在效率和性能上优
→
PDF
4 months ago
EMNLP
基于线性关注力模型建模上下文,实现可扩展的文档级翻译
本文研究了一种基于 Peng et al. (2021) 的线性注意力模型,并通过句子门促进最近归纳偏置,以提高文档级机器翻译的效能和翻译质量,并在 IWSLT 2015 和 OpenSubtitles 2018 上进行了评估和测试,结果表
→
PDF
2 years ago
Prev
Next