MMOct, 2021

TLDR9+:一项大规模资源,用于极端压缩社交媒体帖子

TL;DR本文介绍了 TLDR9 +—— 一个从 Reddit 讨论论坛中提取的包含 900 万多个训练实例的大规模摘要数据集,旨在进行极端摘要,并通过人工注释蒸馏出更细粒度的 TLDRHQ 数据集,进一步点出我们所提出的数据集上不同的最先进的摘要模型。