Mar, 2025

计算技能的最佳规模:知识与推理

TL;DR本研究探讨了计算最佳规模是否会依赖于技能,特别是知识和推理技能。我们发现,不同技能之间的规模规律存在显著差异,对数据集的选择和模型参数的影响可能达到50%。该研究为大规模语言模型的有效开发提供了新的见解。