May, 2018

英印混合代码推文语料库用于讽刺检测

TL;DR通过英 - 印混合码数据集,我们开发了一个基于随机森林分类器并进行了 10 折交叉验证的基线监督分类系统,该系统可以检测到社交媒体上的文字中的反讽,并标记每个标记的语言标签。该系统平均得分为 78.4%。