COLINGMar, 2024

CASIMIR: 科学文章语料库,具有多个作者集成修订功能

TL;DR本研究提出了一个新的文本资源数据集,名为 CASIMIR,其中包含来自 OpenReview 的 15,646 篇科学文章的多个修订版本以及它们的同行评审。这个数据集对科学文章的修订步骤进行了详细的研究,提供了句子级别的对齐和自动提取修订编辑的功能,同时对评估方法进行了质疑。