Jun, 2023

非母语读者的日语词汇复杂性:一个新的数据集

TL;DR构建了针对日语的第一个 LCP 数据集,并通过 BERT 模型在基准实验中证明了其在日语 LCP 任务中的有效性,同时提供了适合中文 / 韩文标注者和其他读者的分离复杂度得分以满足读者的母语特定需求。