BriefGPT.xyz
Ask
alpha
关键词
data quantity
搜索结果 - 4
关于基于 LLMs 驱动的合成数据生成、整理和评估的调查
这篇论文旨在通过提出一种基于合成数据生成的通用工作流程的组织方式,突出现有研究中的差距,并概述未来研究的前景,以引导学术和工业界更深入、更系统地探索基于大型语言模型驱动的合成数据生成的能力和应用。
PDF
22 days ago
分子表示学习中揭示神经比例定律
从数据中心的观点出发,本文研究了分子表示学习的神经缩放行为,在数据量、数据质量和模型容量等四个关键维度上,证实了数据量和分子表示性能之间的一致性幂律关系,并通过详细分析,发现了提高学习效率的可能途径。
PDF
10 months ago
关于预训练数据多样性与微调鲁棒性的关联
预训练对深度学习中的模型性能具有广泛应用,我们的工作旨在理解该训练策略对下游模型的泛化特性的影响。我们发现,影响下游有效鲁棒性的主要因素是数据数量,而其他因素的影响有限。
PDF
a year ago
数据收集对于训练通用目标达成策略的重要性
本文提出了一个基于无监督探索方法的机器人学习模型 ChronoGEM,以能够均匀涵盖可能状态空间为目标。研究了数据量和数据质量对训练通用控制器的影响,并证明数据量和数据质量对于训练高精度达成目标的策略至关重要,以达到各种连续控制情况下的高保
→
PDF
2 years ago
Prev
Next