Sep, 2022

用于讽刺检测的新闻标题数据集

TL;DR本文介绍了使用 TheOnion 和 HuffPost 两个新闻网站的头条新闻构建的包含两万八千条标题的数据集,其中包含了 13K 个讽刺标题,以辅助对 Twitter 数据噪声问题进行的讽刺检测研究,并探讨了数据集的潜在用途。