Feb, 2023

AbLit:用于分析和生成英语文学节选版本的资源

TL;DR本文首次从NLP角度研究了创建文本的节选版本这一问题。我们创造了新的资源AbLit,该数据集基于英文文学书籍的节选版本,捕捉了原始文本和节选版本之间的段落级对齐关系。我们描述了这些对齐的语言关系,并创建了自动化模型来预测这些关系以及为新文本生成缩写。我们的研究结果确定了缩写版本创建作为一项具有挑战性的任务,并为未来的资源和研究提供了动力。该数据集可通过此 http URL获得。