利用文本分类检测欺诈评论
本文探讨了一种处理虚假评论的自然语言处理方法,通过研究 15 种语言特征,证明了虚假评论往往包含更多的废话和长句子,并且应用机器学习算法可以高准确率地辨别出虚假评论。
Oct, 2020
该研究通过比较分析机器学习和基于 Transformer 的方法在欺诈性文本分类中的效果,使用包含欺诈性和非欺诈性文本的标记数据集进行训练和评估,并对不同方法的性能指标进行了广泛实验比较,揭示了机器学习和基于 Transformer 的方法在欺诈性文本分类中的优势和局限性,帮助研究人员和从业者在处理欺诈内容时做出明智决策。
Aug, 2023
本研究结合心理学和计算语言学的工作,研究了欺骗性意见垃圾信息的检测,提出三种方法并开发出在黄金标准意见垃圾信息数据集上准确率接近 90% 的分类器,还进行了特征分析并揭示了欺骗性意见与想象写作之间的关系。
Jul, 2011
本文介绍了利用深度学习方法来检测虚假的评论,并提出了使用多层感知器(MLP)、卷积神经网络(CNN)和长短时记忆(LSTM)的变体等方法,同时也应用了传统的机器学习分类器,如朴素贝叶斯(NB)、K 近邻(KNN)和支持向量机(SVM),并对两种不同分类器的性能进行了比较。
Nov, 2022
本研究提出使用 BERT 模型从文本(即评论)中提取词嵌入来改进现有的虚假评论分类或检测方法,结果表明 SVM 分类器在准确度和 F1 得分方面优于其他分类器,并且比之前的研究中使用的分类器高出 7.6%。
Jan, 2023
本文提出了一种名为 FakeGAN 的系统,它是在文本分类任务中首次采用生成对抗网络(GANs)进行增强,用于检测欺骗性评论。通过使用两个鉴别器模型和一个生成模型,FakeGAN 避免了模式崩溃的问题, 并在 TripAdvisor 酒店评论数据集上表现出与现有监督学习方法相当的性能。
May, 2018
本文介绍了检测协同过滤推荐系统中虚假文本评论的新方法。我们提出了一种基于对比学习的体系结构,利用用户人口特征以及文本评论作为对抗虚假评论的额外证据,从而使推荐系统更加健壮。该方法能够应对两种不同类型的虚假评论(由语言模型生成的虚假评论和由不诚实用户撰写的评论),并且能够减少偏见评论的影响。
Jan, 2023
本研究提出一种新方法将机器学习与消息传递算法相结合,采用主动学习方式进行标签采样,用于判别评论者是垃圾评论者还是正常评论者,并在三大真实数据集中进行实验,证明其在机器学习方法和标签数据较少情况下性能优越。
May, 2022
在线商务依赖于用户生成的评论来提供对物品的客观信息,该论文提出了一种利用机器学习方法进行评论检测和提取的方法,并展示了该方法在对未包含在训练数据中的网站上的使用上的推广性。此方法承诺驱动自动检测和评估评论的应用,无论其来源如何。此外,通过实施和讨论三个关键应用:情感不一致性分析、多语言支持和假评论检测,展示了该方法的多功能性。
May, 2024
本研究对比了多种检测虚假和欺骗性在线评论的技术,应用了多种有效的机器学习方法,提出了一种通过微调最先进的上下文嵌入进行检测的方法,结果表明上下文嵌入在虚假评论检测方面具有潜力,并为未来的研究打下了基础。
Oct, 2020