使用语义相似性检测单一评论垃圾信息

WWWSep, 2016

使用语义相似性检测单一评论垃圾信息

Detecting Singleton Review Spammers Using Semantic Similarity

Vlad Sandulescu, Martin Ester

TL;DR本文讨论了在多个名称下发表假评论的问题，并提出了两种方法来检测相似的评论，结果通常优于以前的向量相似度措施，并对来自三个不同数据集的评论进行了实验。

Abstract

online reviews have increasingly become a very important resource for consumers when making purchases. Though it is becoming more and more difficult for people to make well-informed buying decisions without being deceived by →

online reviews fake reviews opinion spam detecting fake reviews topic modeling

发现论文，激发创造

多元指示信号的时间性舆情垃圾检测

本文介绍一种基于时间的方法，对在线消费者评论进行实时监测，并利用精心选择的指示性信号，设计有效的技术来检测和描述不正常事件，该方法适用于两个不同评论网站的数据集，且快速、有效、实用，可在现实世界的系统中部署。

Mar, 2016

真实还是人造？上下文化观点垃圾信息检测

本研究对比了多种检测虚假和欺骗性在线评论的技术，应用了多种有效的机器学习方法，提出了一种通过微调最先进的上下文嵌入进行检测的方法，结果表明上下文嵌入在虚假评论检测方面具有潜力，并为未来的研究打下了基础。

Oct, 2020

利用文本分类检测欺诈评论

利用机器学习模型鉴别欺诈评论，研究表明被动侵略型分类器在文本分类和欺诈评论中表现最佳。

Jul, 2023

检测越南电子商务网站上的垃圾评论

本文提出了一个叫做 ViSpamReviews 的数据集，用于检测电子商务平台上的垃圾评论，包含两个任务，一个是二分类任务，用于判断评论是否为垃圾评论，另一个是多分类任务，用于识别垃圾评论的类型。 PhoBERT 在两个任务中都表现最好，分别获得了 86.89％和 72.17％的宏平均 F1 分数。

Jul, 2022

通过语言特征分析检测假评论

本文探讨了一种处理虚假评论的自然语言处理方法，通过研究 15 种语言特征，证明了虚假评论往往包含更多的废话和长句子，并且应用机器学习算法可以高准确率地辨别出虚假评论。

Oct, 2020

发现任何一段虚假的言论垃圾

本研究结合心理学和计算语言学的工作，研究了欺骗性意见垃圾信息的检测，提出三种方法并开发出在黄金标准意见垃圾信息数据集上准确率接近 90% 的分类器，还进行了特征分析并揭示了欺骗性意见与想象写作之间的关系。

Jul, 2011

使用机器学习和基于网络的算法进行意见垃圾检测的新方法

本研究提出一种新方法将机器学习与消息传递算法相结合，采用主动学习方式进行标签采样，用于判别评论者是垃圾评论者还是正常评论者，并在三大真实数据集中进行实验，证明其在机器学习方法和标签数据较少情况下性能优越。

May, 2022

使用监督机器学习和 BERT 模型进行在线虚假评论检测

本研究提出使用 BERT 模型从文本（即评论）中提取词嵌入来改进现有的虚假评论分类或检测方法，结果表明 SVM 分类器在准确度和 F1 得分方面优于其他分类器，并且比之前的研究中使用的分类器高出 7.6％。

Jan, 2023

在电子商务平台中使用混合算法寻找虚假评论

我们提出了一种创新的集成方法来进行情感分析以找到伪造评论，它结合了支持向量机、K 最近邻算法和决策树分类器的预测能力，从而在伪造评论预测中实现了卓越的准确性和鲁棒性，突显了集成技术在使用混合算法中开展伪造评论研究方面的潜力。

Apr, 2024

增强型评论检测与识别：对跨平台应用的方法研究（以在线商务为例）

在线商务依赖于用户生成的评论来提供对物品的客观信息，该论文提出了一种利用机器学习方法进行评论检测和提取的方法，并展示了该方法在对未包含在训练数据中的网站上的使用上的推广性。此方法承诺驱动自动检测和评估评论的应用，无论其来源如何。此外，通过实施和讨论三个关键应用：情感不一致性分析、多语言支持和假评论检测，展示了该方法的多功能性。

May, 2024