关键词layernorm
搜索结果 - 11
  • 关注掩码和层归一化在 Transformer 中的作用
    PDFa month ago
  • ICML简化线性注意力和渐进重参数化批归一化的高效 Transformer (SLAB)
    PDFa month ago
  • 层归一化的几何和动力学
    PDF2 months ago
  • LayerNorm: 参数高效微调中的关键组件
    PDF3 months ago
  • 离线强化学习中 Q 值离散度的理解、预测和改善
    PDF9 months ago
  • ACL关于 LayerNorm 在 Transformer 注意力机制中表现力的作用
    PDFa year ago
  • XAI for Transformers: 通过保守传递实现更好的解释
    PDF2 years ago
  • ACLBERT 破坏者:干扰变换器的异常维度
    PDF3 years ago
  • Batch Norm 是否独特?一个经验性研究与处方,在不依赖 Batch 的情况下模拟常见归一化器的最佳性能
    PDF4 years ago
  • 理解和改善层归一化
    PDF5 years ago
  • 均方根层标准化
    PDF5 years ago
Prev
Next