关键词memory footprint
搜索结果 - 43
  • Adam-mini: 更少的学习率,取得更多的收益
    PDF6 days ago
  • 前瞻思考:内存高效的联邦微调语言模型
    PDFa month ago
  • 语言模型中低秩分解的精度 - 效率权衡特征化
    PDF2 months ago
  • 深度神经网络加速器中的量化和映射协同探索
    PDF3 months ago
  • SEER-MoE:稀疏专家效率通过正则化的混合专家模型
    PDF3 months ago
  • 通过训练后的层内多精度量化减少 DNN 内存占用
    PDF3 months ago
  • GES: 通用指数溅射用于高效辐亮场渲染
    PDF4 months ago
  • 量化侧调优:快速和内存高效优化量化大型语言模型
    PDF6 months ago
  • PatchMorph:无监督 3D 脑图像配准的随机深度学习方法
    PDF7 months ago
  • 基于块压缩特征的实时神经材料
    PDF8 months ago
  • 模型压缩的参数共享之辩
    PDF8 months ago
  • BitNet:面向大型语言模型的 1 比特 Transformer 的扩展
    PDF8 months ago
  • EMNLP使用哨兵标记对自回归 Transformer 进行上下文压缩
    PDF9 months ago
  • 通过动态嵌入修剪对预训练语言模型实现令人烦恼的简单记忆效率
    PDF9 months ago
  • 分布式图神经网络训练的分区策略实验比较
    PDF10 months ago
  • 通过权重残差的低阶逼近实现精调模型的高效存储
    PDFa year ago
  • 重新发现使用哈希随机投影以高效量化上下文化句子嵌入
    PDFa year ago
  • AUTODIAL:高效异步任务导向对话模型
    PDFa year ago
  • GACT: 通用网络结构激活压缩训练
    PDF2 years ago
  • 基于矩阵微分方程的低秩神经网络高效发现:低秩彩票
    PDF2 years ago
Prev