EMNLPApr, 2020

学习音乐有助于阅读:利用迁移研究语言模型中的语言结构

TL;DR本文提出了迁移学习作为一种分析神经语言模型中语法结构编码的方法,并发现训练模型在具有潜在结构的非语言数据上,如 MIDI 音乐或 Java 代码,可以提高模型在自然语言上的测试性能。作者还通过实验发现,在人工括号语言数据的训练中,模型对于层级递归结构的学习也有助于提高在自然语言测试上的性能,并且迁移学习的性能与语言类型的句法相似性密切相关,说明模型的预训练是具有学科跨越性质的。