Jan, 2022

使用 CsFEVER 和 CTKFacts 获取捷克数据进行事实验证

TL;DR本文介绍了获取捷克语数据进行自动事实核查的方法,其中提出了一种混合机器翻译和文档对齐的方法来生成一个基于 Wikipedia 的大规模 FEVER 数据集的捷克语版本,以及一种可靠应用于自然语言推理任务的 CsFEVER-NLI 版本。同时,还介绍了使用捷克新闻机构语料库对一些数据进行扩展注释,以及该数据集的基线模型和注释平台等实验数据。