BriefGPT.xyz
大模型
Ask
alpha
关键词
data-juicer
搜索结果 - 2
技术报告:更好混合的竞争解决方案
在大规模模型时代,选择和优化海量复杂数据集以提高大型语言模型的性能,在有限的计算资源约束下成为一项重大挑战。本文详细介绍了我们在 BetterMixture 挑战中的解决方案,着重于对大型语言模型进行微调数据混合。我们的方法在数据去重、低级
→
PDF
3 months ago
Data-Juicer:大型语言模型的一站式数据处理系统
我们提出了一种强大而灵活、易于使用的数据处理系统 Data-Juicer,它提供了 50 多种内置的多功能操作符和可插拔工具,通过可视化和自动化评估能力,加快数据处理并获得数据洞察力,提供用户友好的界面并发布多种数据配方,同时实现高效和可扩
→
PDF
10 months ago
Prev
Next