ACLJan, 2024

基于 Transformer 模型的多词表达语义研究:一项调查

TL;DR通过对多词表达式的深入调查,我们发现 Transformer 模型在捕捉多词表达式的语义上存在不一致性,主要依赖表面模式和记忆信息,并且其表示在架构的早期层中主要存在。另外,我们强调了更直接可比较的评估设置的需求。