ACLOct, 2021

神经语言模型中的词汇习得

TL;DR研究神经语言模型在训练过程中如何获取单词,并提取 MacArthur-Bates 交际发展清单上 600 多个单词的学习曲线和获取年龄。与儿童的单词获取研究结合,评估 LSTMs、BERT 和 GPT-2 模型的多种预测因素,发现模型对单词频率的依赖程度远高于儿童,但与儿童相似的是,它们在更长的话语中学习单词较慢。同时,模型在训练过程中遵循一致的模式,这些结果为人类语言模型的更类人化语言习得提供了启示。