Apr, 2021

Transformer 能通过 Wug 测试吗?调整神经形态变化模型中的复制偏差

TL;DR研究表明,将深度学习序列模型用于形态学变化的任务可以取得良好的结果。然而标准模型,如 Transformer,在推广变形模式方面表现很差。为了解决这个问题,我们提出了一种基于子串的生成模型,能够更好地处理之前没有训练过的词形,并在实验中获得了显著的性能提升。