关键词layer normalization
搜索结果 - 24
  • ICML通过近似和共享反向传播减少微调内存开销
    PDF10 days ago
  • ICML关于层归一化的非线性性
    PDFa month ago
  • 解析神经网络可塑性丧失的原因
    PDF4 months ago
  • 旅行之词:Transformer 的几何解释
    PDF10 months ago
  • 规范化就足够了:理解极端标签偏移下的层归一化联邦学习
    PDFa year ago
  • Pre-RMSNorm 与 Pre-CRMSNorm 变压器:等效且高效的 Pre-LN 变压器
    PDFa year ago
  • ACL层归一化对零样本神经机器翻译的影响探究
    PDFa year ago
  • 仅调整规范层的表达能力
    PDFa year ago
  • 预训练语言模型层归一化参数有效调整
    PDF2 years ago
  • 批归一化在自然语言处理中 Transformer 失败的原因
    PDF2 years ago
  • MM加速和稳定 Transformer 的统一规范化
    PDF2 years ago
  • 论 Transformers 中的层标准化与残差连接
    PDF2 years ago
  • ACL克服自注意力机制的理论限制
    PDF2 years ago
  • ICLR从图的视角重新审视 BERT 中的过度平滑问题
    PDF2 years ago
  • EMNLP将残差和归一化层引入掩码语言模型分析中
    PDF3 years ago
  • COLING使用层归一化重新思考 Transformer 和 ResNet 中的跳跃连接
    PDF3 years ago
  • Transformer 架构中的层标准化
    PDF4 years ago
  • ACL机器翻译的深度 Transformer 模型学习
    PDF5 years ago
  • 实例级元归一化
    PDF5 years ago
  • 基于领域层归一化的无监督风格图像描述生成
    PDF6 years ago
Prev