Apr, 2017

用于讽刺的大型自注释语料库

TL;DR该论文介绍了自注释 Reddit 语料库(SARC),该语料库为讽刺研究以及训练和评估讽刺检测系统提供了大量的数据。每个陈述还被作者自行注释,并配有用户、主题和对话上下文。通过构建基准测试和评估基线方法,我们对该语料库进行了准确度评估。