ACLApr, 2018
新闻室:一个包含多元提取策略的 130 万篇文章摘要数据集
Newsroom: A Dataset of 1.3 Million Summaries with Diverse Extractive Strategies
Max Grusky, Mor Naaman, Yoav Artzi
TL;DR利用搜索和社交媒体元数据,我们构建了 1.3 百万篇文章及其摘要的 NEWSROOM 数据集,包含不同风格的抽象和抽取策略,为评估该数据集的效用和挑战,我们对该数据集进行了分析和训练现有方法。