BriefGPT.xyz
大模型
Ask
alpha
关键词
pretraining distribution
搜索结果 - 1
具有可扩展在线双层优化的自适应训练分布
在现代机器学习中,基于网络规模的大型神经网络学习成为核心。本研究考虑在一个与应用领域不匹配的混杂预训练数据集的情况下,通过调整预训练分布的算法来适应目标测试条件。通过在线双层优化问题的一种近期表述,提出了一种算法,并考虑了可扩展性,该算法优
→
PDF
7 months ago
Prev
Next