May, 2022

ELQA: 英文语言问题及答案语料库

TL;DR本文介绍一个包含 18 万多个有关英语语言的问题和答案的共同数据集,这个数据集可以用于语言学习者的自然语言处理应用,并介绍了以这个数据集为基础的三个任务:1)回答质量分类、2)语义搜索查找相似问题和 3)回答生成,并展示了当前基于 Transformer 模型的优缺点和基线方法。该数据集和脚本已经公开发布用于未来的研究。