BriefGPT.xyz
大模型
Ask
alpha
关键词
training cost reduction
搜索结果 - 4
从大型矿石中提炼金:通过关键样本选择实现高效数据集精馏
本文提出了一种基于信息理论和样本价值的新的数据集精简方法,经过全面的数据选择分析,该方法能够极大的降低训练成本,扩展现有的精简算法到更大规模、更多元化的数据集上,并且能够在多种不同类型的数据集上持续提高性能。
PDF
a year ago
ICML
DeepSpeed-MoE: 推动混合专家推理和训练以推动下一代 AI 规模
本文介绍了一种通过 Mixture-of-Experts 模型架构实现的深度学习模型训练及推断方案,名为 DeepSpeed-MoE。该方案通过新颖的模型压缩技术和高度优化的推断系统,在减小模型尺寸、提高能效和降低硬件资源要求等方面都有着非
→
PDF
2 years ago
双向神经机器翻译与合成平行数据
本论文提出一种结合了回译和多语言神经机器翻译技术的新技术,通过为一个语言对训练一个模型来改善在低资源和跨领域情况下的机器翻译效果,并且能显著降低培训和部署成本。
PDF
6 years ago
AAAI
通过动态类别选择加速大规模分类训练
本篇研究提出了一种基于动态类层次结构及自适应分配方案的新方法,对大规模分类问题进行高效、准确处理,并在多个大型基准测试中显著减少训练成本和内存需求,同时保持竞争性能。
PDF
6 years ago
Prev
Next