Jun, 2024
隐藏能力的出现:探索概念空间中的学习动态
Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space
Core Francisco Park, Maya Okawa, Andrew Lee, Ekdeep Singh Lubana, Hidenori Tanaka
TL;DR通过新的概念空间框架分析模型的学习动态,在合成定义的玩具数据集上发现生成模型具备突然且一致地在训练过程中出现的潜在能力,虽然模型可能在普通输入提示下无法展示这些能力。