关键词layernorm
搜索结果 - 11
- 关注掩码和层归一化在 Transformer 中的作用PDFa month ago
- ICML简化线性注意力和渐进重参数化批归一化的高效 Transformer (SLAB)PDFa month ago
- 层归一化的几何和动力学PDF2 months ago
- LayerNorm: 参数高效微调中的关键组件PDF3 months ago
- 离线强化学习中 Q 值离散度的理解、预测和改善PDF9 months ago
- ACL关于 LayerNorm 在 Transformer 注意力机制中表现力的作用PDFa year ago
- XAI for Transformers: 通过保守传递实现更好的解释PDF2 years ago
- ACLBERT 破坏者:干扰变换器的异常维度PDF3 years ago
- Batch Norm 是否独特?一个经验性研究与处方,在不依赖 Batch 的情况下模拟常见归一化器的最佳性能PDF4 years ago
- 理解和改善层归一化PDF5 years ago
- 均方根层标准化PDF5 years ago
Prev
Next