关键词sparse models
搜索结果 - 27
  • ALPS:面向大型语言模型的高度稀疏一次性修剪的改进优化
    PDF22 days ago
  • ICML更稀疏,更好,更深,更强:通过精确正交初始化改进稀疏训练
    PDFa month ago
  • 基于贝叶斯的联邦模型压缩技术提升通信与计算效率
    PDF3 months ago
  • RESSA:通过稀疏跨模态适应修复稀疏视觉语言模型
    PDF3 months ago
  • 通过更稀疏的选择提高稀疏模型的效率
    PDF4 months ago
  • 基于顺序注意力的块稀疏化:可微剪枝结合组合优化
    PDF4 months ago
  • LCEN:一种用于非线性、可解释机器学习模型的新型特征选择算法
    PDF4 months ago
  • EsaCL:高效学习稀疏模型
    PDF6 months ago
  • 平衡行动:在稀疏模型中约束不平等影响
    PDF8 months ago
  • SparseByteNN:一种基于细粒度分组稀疏性的新型移动推理加速框架
    PDF8 months ago
  • 面向百万级依赖建模的长序列模型的统一视图
    PDFa year ago
  • 稀疏循环利用:从密集检查点训练专家混合模型
    PDF2 years ago
  • EMNLP谁说大象不能奔跑:将大规模 MoE 模型引入云计算生产环境
    PDF2 years ago
  • 学习 ASR 路径:一种稀疏多语言 ASR 模型
    PDF2 years ago
  • Monarch: 高效准确训练的表达性结构矩阵
    PDF2 years ago
  • 利用元梯度在初始化时寻找可训练权重的潜在剪枝
    PDF2 years ago
  • 神经模型训练的搜索空间
    PDF3 years ago
  • ACL成功将稳定化彩票假设应用于 Transformer 结构
    PDF4 years ago
  • 使用进化策略和混合方法进行不可微监督学习
    PDF5 years ago
  • ACL稀疏序列到序列模型
    PDF5 years ago
Prev