使用语义相似性检测单一评论垃圾信息
本文介绍一种基于时间的方法,对在线消费者评论进行实时监测,并利用精心选择的指示性信号,设计有效的技术来检测和描述不正常事件,该方法适用于两个不同评论网站的数据集,且快速、有效、实用,可在现实世界的系统中部署。
Mar, 2016
本研究对比了多种检测虚假和欺骗性在线评论的技术,应用了多种有效的机器学习方法,提出了一种通过微调最先进的上下文嵌入进行检测的方法,结果表明上下文嵌入在虚假评论检测方面具有潜力,并为未来的研究打下了基础。
Oct, 2020
本文提出了一个叫做 ViSpamReviews 的数据集,用于检测电子商务平台上的垃圾评论,包含两个任务,一个是二分类任务,用于判断评论是否为垃圾评论,另一个是多分类任务,用于识别垃圾评论的类型。 PhoBERT 在两个任务中都表现最好,分别获得了 86.89%和 72.17%的宏平均 F1 分数。
Jul, 2022
本文探讨了一种处理虚假评论的自然语言处理方法,通过研究 15 种语言特征,证明了虚假评论往往包含更多的废话和长句子,并且应用机器学习算法可以高准确率地辨别出虚假评论。
Oct, 2020
本研究结合心理学和计算语言学的工作,研究了欺骗性意见垃圾信息的检测,提出三种方法并开发出在黄金标准意见垃圾信息数据集上准确率接近 90% 的分类器,还进行了特征分析并揭示了欺骗性意见与想象写作之间的关系。
Jul, 2011
本研究提出一种新方法将机器学习与消息传递算法相结合,采用主动学习方式进行标签采样,用于判别评论者是垃圾评论者还是正常评论者,并在三大真实数据集中进行实验,证明其在机器学习方法和标签数据较少情况下性能优越。
May, 2022
本研究提出使用 BERT 模型从文本(即评论)中提取词嵌入来改进现有的虚假评论分类或检测方法,结果表明 SVM 分类器在准确度和 F1 得分方面优于其他分类器,并且比之前的研究中使用的分类器高出 7.6%。
Jan, 2023
我们提出了一种创新的集成方法来进行情感分析以找到伪造评论,它结合了支持向量机、K 最近邻算法和决策树分类器的预测能力,从而在伪造评论预测中实现了卓越的准确性和鲁棒性,突显了集成技术在使用混合算法中开展伪造评论研究方面的潜力。
Apr, 2024
在线商务依赖于用户生成的评论来提供对物品的客观信息,该论文提出了一种利用机器学习方法进行评论检测和提取的方法,并展示了该方法在对未包含在训练数据中的网站上的使用上的推广性。此方法承诺驱动自动检测和评估评论的应用,无论其来源如何。此外,通过实施和讨论三个关键应用:情感不一致性分析、多语言支持和假评论检测,展示了该方法的多功能性。
May, 2024