关键词multi-head attention
搜索结果 - 88
  • EMNLP多任务学习下多头注意力中的功能专业化解释与利用
    PDF9 months ago
  • EMNLP对抗多头:利用注意力头嵌入实现高效参数的多头注意力
    PDF9 months ago
  • SPION: 基于卷积漫延的 Transformer 分层稀疏训练
    PDF9 months ago
  • MA-VAE:基于多头注意力的变分自编码器方法用于汽车耐久性动力系统测试中的异常检测
    PDF10 months ago
  • AST-MHSA:使用多头自注意力进行代码摘要
    PDFa year ago
  • RCMHA: 相对卷积多头注意力用于自然语言建模
    PDFa year ago
  • Transformer 中多头注意力的记忆容量
    PDFa year ago
  • 多窗口关注遮蔽自编码器更好的音频学习者
    PDFa year ago
  • 利用概率形态剪枝进行预算感知的图卷积网络设计
    PDFa year ago
  • ICMLCOMCAT:注重效率的基于注意力机制的视觉模型压缩和定制化
    PDFa year ago
  • ACL多头注意力的支柱寻找
    PDFa year ago
  • 利用单元级注意状态表示增强协作多智能体强化学习的价值分解
    PDFa year ago
  • ACL关于 LayerNorm 在 Transformer 注意力机制中表现力的作用
    PDFa year ago
  • ACL将视觉场景图转换为图像说明
    PDFa year ago
  • 面向百万级依赖建模的长序列模型的统一视图
    PDFa year ago
  • 3D 点云地图中的 6DoF 定位:Slice Transformer 和自监督学习
    PDFa year ago
  • InferEM:推断说话人的意图用于共情对话生成
    PDF2 years ago
  • Transformer 层的神经 ODE 解释
    PDF2 years ago
  • EMNLP基于注意力头的注意力混合模型:逐标记选择注意力头
    PDF2 years ago
  • 基于 Transformer 的自适应稀疏和单调注意力自动语音识别
    PDF2 years ago