Jan, 2022
使用 CsFEVER 和 CTKFacts 获取捷克数据进行事实验证
CsFEVER and CTKFacts: Acquiring Czech data for fact verification
Herbert Ullrich, Jan Drchal, Martin Rýpar, Hana Vincourová, Václav Moravec
TL;DR本文介绍了获取捷克语数据进行自动事实核查的方法,其中提出了一种混合机器翻译和文档对齐的方法来生成一个基于 Wikipedia 的大规模 FEVER 数据集的捷克语版本,以及一种可靠应用于自然语言推理任务的 CsFEVER-NLI 版本。同时,还介绍了使用捷克新闻机构语料库对一些数据进行扩展注释,以及该数据集的基线模型和注释平台等实验数据。