ICMLMay, 2024

探索从认知到表达的 LLM 之旅

TL;DR该研究以百川 - 7B 和百川 - 33B 为焦点,深入探讨大型语言模型的认知和表达能力在预训练、监督微调和强化学习三个关键阶段的发展规律,揭示了认知能力在预训练阶段建立,而表达能力主要在微调和强化学习阶段提升的顺序性发展模式,并探索了这些差异发展轨迹与 LLMs 的架构设计之间的理论基础,同时评估了少样本学习和重复采样等优化无关策略对认知和表达能力之间的桥梁作用,从而为培训过程的可解释性和可控性提供了有价值的洞见。