关键词multi-head attention
搜索结果 - 88
- EMNLP多任务学习下多头注意力中的功能专业化解释与利用PDF9 months ago
- EMNLP对抗多头:利用注意力头嵌入实现高效参数的多头注意力PDF9 months ago
- SPION: 基于卷积漫延的 Transformer 分层稀疏训练PDF9 months ago
- MA-VAE:基于多头注意力的变分自编码器方法用于汽车耐久性动力系统测试中的异常检测PDF10 months ago
- AST-MHSA:使用多头自注意力进行代码摘要PDFa year ago
- RCMHA: 相对卷积多头注意力用于自然语言建模PDFa year ago
- Transformer 中多头注意力的记忆容量PDFa year ago
- 多窗口关注遮蔽自编码器更好的音频学习者PDFa year ago
- 利用概率形态剪枝进行预算感知的图卷积网络设计PDFa year ago
- ICMLCOMCAT:注重效率的基于注意力机制的视觉模型压缩和定制化PDFa year ago
- ACL多头注意力的支柱寻找PDFa year ago
- 利用单元级注意状态表示增强协作多智能体强化学习的价值分解PDFa year ago
- ACL关于 LayerNorm 在 Transformer 注意力机制中表现力的作用PDFa year ago
- ACL将视觉场景图转换为图像说明PDFa year ago
- 面向百万级依赖建模的长序列模型的统一视图PDFa year ago
- 3D 点云地图中的 6DoF 定位:Slice Transformer 和自监督学习PDFa year ago
- InferEM:推断说话人的意图用于共情对话生成PDF2 years ago
- Transformer 层的神经 ODE 解释PDF2 years ago
- EMNLP基于注意力头的注意力混合模型:逐标记选择注意力头PDF2 years ago
- 基于 Transformer 的自适应稀疏和单调注意力自动语音识别PDF2 years ago