ACLMar, 2022

探究微调模型时数据大小的重要性

TL;DR研究表明优化 Fine-tuning 效果的原因是 Fine-tuning 的数据集大小,同时数据集大小会影响编码的语言知识程度,而且数据集大小主要影响神经网络的高层,且这种影响程度跟 Fine-tuning 迭代次数有关。