Sep, 2023

JCoLA: 日语语言可接受性语料库

TL;DR通过 JCoLA 数据集,对 9 种不同类型的日语语言模型进行了句法知识评估,结果表明有些模型在领域内数据上能超越人类表现,但在领域外数据上无法超越人类表现,并且通过对语言现象的错误分析发现,神经语言模型在处理像参数结构这样的局部语法依赖时表现出色,但在面对像动词一致和 NPI 授权这样的长距离语法依赖时表现出衰退。