BriefGPT.xyz
Ask
alpha
关键词
multi-path structure
搜索结果 - 3
EMNLP
多路径变换器更好:神经机器翻译的案例研究
本文研究了通过参数效率的多路径结构,如何影响变压器 (Transformer) 模型,并通过 12 个 WMT 机器翻译任务的广泛实验表明,使用相同数量的参数,较浅的多路径模型可以实现类似甚至更好的性能,揭示了在训练更好的大型 Transf
→
PDF
a year ago
局部到全局的视觉 Transformer 自注意力
本研究提出了多通路结构的 Transformer 模型,实现局部到全局的多粒度特征推理,相较于现有的分层设计模型,在增加了极小的计算量的同时,在图像分类和语义分割任务上取得了显著的提高。
PDF
3 years ago
AAAI
广义域条件自适应网络
本文提出了一种基于多通路结构、利用领域专业特征进行自适应知识提取的域适应方法,通过添加特定领域的注意力机制探索低层次的领域特异性特征以及特定层次的知识适应块来提高适应性。
PDF
3 years ago
Prev
Next