BriefGPT.xyz
Ask
alpha
关键词
dma
搜索结果 - 2
利用深度多元专家方法检测 TempoWiC 中的词义漂移
本文主要描述了 DMA 提交至 TempoWiC 任务的情况,其中取得了 77.05%的宏 F1 得分,获得了该任务的第一名。我们首先探讨了不同预训练语言模型的影响。然后,我们采用数据清洗,数据增强和对抗训练策略来增强模型的泛化能力和鲁棒性
→
PDF
2 years ago
DMFormer:缩小 CNN 和 Vision Transformer 之间的差距
本文提出了一种动态多级注意力机制 (DMA),它通过多个卷积核大小捕捉输入图像的不同模式,并通过门控机制实现输入自适应权重,然后提出了一种名为 DMFormer 的有效骨干网络,该网络采用了 DMA 替代了视觉变换器中的自我关注机制。在 I
→
PDF
2 years ago
Prev
Next