Nov, 2023

将神经语言模型在发展合理数据的课程中进行训练,是否可以提高与人类阅读行为的一致性?

TL;DR使用神经语言模型对人类行为进行建模在研究中获得了不同的结果。本文通过在 BabyLM 挑战中使用更贴近发展的数据集来探索实证数据和模型预测行为之间的不匹配程度。通过对 BabyLM 的数据集进行师生训练和课程设计,研究发现,虽然这种改进使得模型更容易从训练数据中获取语言知识,但并未导致模型对人类阅读行为的预测与之更加一致,这表明仅仅在发展上合理的数据集上训练模型可能不足以准确预测人类语言处理。