BriefGPT.xyz
大模型
Ask
alpha
关键词
model checkpoints
搜索结果 - 4
FastPersist:加速深度学习中的模型检查点
FastPersist 通过结合 NVMe 的优化、有效的写并行化以及与独立的训练计算重叠的检查点创建方式,实现了在持久存储中创建检查点的加速,相比基线方法快速 116 倍,并实现了每次迭代检查点的无可忽略开销。
PDF
15 days ago
Mevaker: 希伯来语的结论提取和资源分配
该论文介绍了基于以色列国家审计长与公民监察员报告的 MeVakerSumm 和 MeVakerConc 数据集,以及两个辅助数据集,同时提供了用于结论提取(HeConE,HeConEspc)和结论分配(HeCross)的模型。本论文中使用的
→
PDF
4 months ago
无参考单块偏好优化与胜负比率
优先对齐算法、受监督的微调 (SFT)、单体化比值偏好优化算法 (ORPO)、最新的语言模型和模型检查点
PDF
4 months ago
强健的跨语言转移:通过模型检查点平均化实现免费午餐
本文探讨了在跨语种任务上,fine-tuning 的模型在模型点上的性能评估并不符合 zero-shot 和 few-shot 学习的前提;并提出了一种更为稳健的模型检查点平均方法,特别是在没有标注的目标语言数据的情况下,该方法在多个任务和
→
PDF
a year ago
Prev
Next