EMNLPOct, 2021

SciXGen:面向上下文感知文本生成的科学论文数据集

TL;DR文章提出了一种新的任务,即科学领域的上下文感知文本生成,并介绍了规模庞大的科学论文数据集 SciXGen,其中包含了 205,304 篇完全注释的论文和广泛使用对象(如表格,图形,算法)的完整引用。使用最新技术进行综合性评估,同时公开数据集和基准,以促进科学文本生成研究。