关键词memory efficiency
搜索结果 - 67
- EDGE-LLM:通过层间统一压缩和自适应层调整与投票在边缘设备上实现高效的大型语言模型适应PDF10 days ago
- ElasticRec:一种基于微服务的模型服务架构,实现对推荐模型的弹性资源扩缩容PDF21 days ago
- LLM 的低秩量化感知训练PDF22 days ago
- S3D:一种用于低内存 GPU 的简单且具有成本效益的自我推测解码方案PDFa month ago
- 前向 - 后向知识蒸馏的持续聚类PDFa month ago
- 可控内存的管道并行PDFa month ago
- CoMERA:基于等级自适应张量优化的计算和内存高效训练PDFa month ago
- SnapKV: LLM 在生成之前了解您要寻找的内容PDF2 months ago
- ICLR层次化上下文合并:提升预训练语言模型对长上下文的理解能力PDF3 months ago
- 预打包:大语言模型快速预填和增加吞吐量的简单方法PDF3 months ago
- DenseNets 重装上阵:超越 ResNets 和 ViTs 的范式转变PDF3 months ago
- CVPRFedMef: 朝着内存高效的联邦动态修剪PDF3 months ago
- 增益前复制粘贴:面向运动场景的数据和内存效率导向的实例分割框架PDF3 months ago
- 稀疏 MeZO: 更少参数在零阶 LLM 微调中取得更好性能PDF4 months ago
- 重新考虑用于内存高效 LLM 微调的零阶优化:基准测试PDF4 months ago
- DenseFormer: 通过深度加权平均增强 Transformer 中的信息流传PDF5 months ago
- InvertibleNetworks.jl:可扩展的标准化流的 Julia 软件包PDF6 months ago
- 预训练语言模型的参数高效微调方法:关键评估与考察PDF6 months ago
- 为了提升少样本分类的表格数据序列化PDF6 months ago
- 通过对抗预测匹配进行数据集压缩PDF7 months ago
Prev