BriefGPT.xyz
Ask
alpha
关键词
twitter datasets
搜索结果 - 4
用于讽刺检测的新闻标题数据集
本文介绍了使用 TheOnion 和 HuffPost 两个新闻网站的头条新闻构建的包含两万八千条标题的数据集,其中包含了 13K 个讽刺标题,以辅助对 Twitter 数据噪声问题进行的讽刺检测研究,并探讨了数据集的潜在用途。
PDF
2 years ago
EMNLP
基于多视角主动学习的用户生成数据短文本分类
本研究提出了一种新的主动学习模型,利用多视图主动学习、Parzen-Rosenblatt 窗口方法和基于预测器的委员会策略等,用于检测自然灾害的正向报道,并在四个不同应用的 Twitter 数据集上通过实验验证该模型的高一致性和优越性。
PDF
3 years ago
Twitter 数据集持续性的纵向评估
研究了 30 个推特数据集,发现尽管可用推文的比例随着数据集的老化而降低,但回收到的子集的文本内容仍然在很大程度上代表了最初收集的整个数据集。与此同时,元数据的代表性随时间而减少,这对使用公共的推特数据集的研究人员有重要意义。
PDF
7 years ago
利用文本和网络上下文定位社交媒体用户
提出了一种基于自适应网格的基于文本的方法和基于混合网络 - 文本方法相结合的方法,这两种方法在三个 Twitter 数据集上都取得了最先进的结果,特别是在用户图不充分连接的情况下,混合方法表现更好。
PDF
9 years ago
Prev
Next