ACLMay, 2023
WYWEB: 一个用于中国古典文献 NLP 评估的基准数据集
WYWEB: A NLP Evaluation Benchmark For Classical Chinese
Bo Zhou, Qianglong Chen, Tianyu Wang, Xiaomi Zhong, Yin Zhang
TL;DR本文介绍 WYWEB 评估基准,它由 9 个古汉语 NLP 任务组成,包括句子分类、序列标注、阅读理解和机器翻译,并评估了现有的预训练语言模型在这个基准上的表现,并提出了一些补充数据集和工具,以进一步促进古代汉语 NLU 的进展。