ACLMay, 2023

WYWEB: 一个用于中国古典文献 NLP 评估的基准数据集

TL;DR本文介绍 WYWEB 评估基准,它由 9 个古汉语 NLP 任务组成,包括句子分类、序列标注、阅读理解和机器翻译,并评估了现有的预训练语言模型在这个基准上的表现,并提出了一些补充数据集和工具,以进一步促进古代汉语 NLU 的进展。