文本评论中的解释性异常检测：主观情景能否正确评估？

Nov, 2023

文本评论中的解释性异常检测：主观情景能否正确评估？

Explained anomaly detection in text reviews: Can subjective scenarios be correctly evaluated?

David Novoa-Paradela, Oscar Fontenla-Romero, Bertha Guijarro-Berdiñas

TL;DR本文提出了一个用于在在线平台上检测和解释异常评论的流程。该流程由三个模块组成，可检测出无价值或恶意组合的评论，并提供分类的正常度评分和解释。通过对大型亚马逊数据库创建的不同数据集进行评估，证明了该流程解决异常检测任务的能力。此外，通过对 241 名参与者进行三种可解释性技术的比较研究，评估了可解释性模块的影响。该研究旨在衡量解释对被调查人重现分类模型以及其感知有用性的影响。这项工作对于自动化处理在线评论平台（如电子商务）中的任务，并为解决文本数据异常检测领域的类似问题提供了灵感。我们还认为，在检测异常评论等真实且罕见的场景中，进行了对不同解释技术能力的人类评估，这一点很有意义，同时也需要对是否可能解释这类主观任务进行思考。

Abstract

This paper presents a pipeline to detect and explain anomalous reviews in online platforms. The pipeline is made up of three modules and a

anomalous reviews pipeline explanation normality score anomaly detection

发现论文，激发创造

增强型评论检测与识别：对跨平台应用的方法研究（以在线商务为例）

在线商务依赖于用户生成的评论来提供对物品的客观信息，该论文提出了一种利用机器学习方法进行评论检测和提取的方法，并展示了该方法在对未包含在训练数据中的网站上的使用上的推广性。此方法承诺驱动自动检测和评估评论的应用，无论其来源如何。此外，通过实施和讨论三个关键应用：情感不一致性分析、多语言支持和假评论检测，展示了该方法的多功能性。

May, 2024

在线检测及信息图解的垃圾评论与数据漂移适应

提出了一种在线解决方案，用于识别和解释垃圾评论，包括数据漂移适应，达到了 87% 的垃圾评论 F-measure。

Jun, 2024

PUPAE：直观且可操作的时间序列异常解释

近年来，在时间序列异常检测方面取得了显著进展，然而，在检测到异常后，我们能够解释它吗？本文介绍了一种领域无关的反事实解释技术，用于产生时间序列异常的直观且可行动的可视化和基于文本的解释。

Jan, 2024

利用合成评论提高可解释性推荐

论文提出了一种使用生成文本解释推荐结果的框架，旨在为推荐系统提供可解释性，实现个性化解释，实验结果表明，与人类编写的评论相比，生成的评论在推荐性能方面表现更好。

Jul, 2018

重新思考用户研究设计以评估模型解释

该研究通过一个众包实验，探讨解释机器学习模型的预测对人类是否具有帮助，并发现在给定特征系数的情况下，人们能够更有效地对线性词袋模型进行操纵，但解释对 BERT 型分类器并没有显著提高操纵能力，而通过伪造 BERT 模型的线性模型的对全局归属的解释则可以有效地操作 BERT 型模型。

Dec, 2021

文本分类可解释性技术的诊断研究

本文评估了不同的解释方法及其对神经网络和文本分类任务的影响，发现梯度基础的解释方法在不同任务及神经网络结构中表现最佳。

Sep, 2020

文本数据深度学习异常检测方法

使用深度学习和变换器架构结合经典机器学习算法以检测和识别文本中的异常，将所有文本上下文转换为数字表示。

Nov, 2022

X-MAN: 解释视频中多个异常源

文中提出了一种可以理解的概率异常检测器，可以通过高级概念描述其响应的原因，并且是首个将对象交互考虑在内并提供异常解释的任务。

Jun, 2021

面向人本解释性文本分类基准的探索

本文探讨了已有的文本分类数据集不能准确反映真实应用场景的问题，并提出了两点解决方案：一是在文本分类数据集中增加可解释性的评价指标，二是通过人类的应用场景与判断加强数据集的教学力度。

Nov, 2022

通过批评与解释交互

本文提出了一种新颖的使用方面标记的技术，可以从评论文本中生成个性化的推荐解释，允许用户通过批判文本解释来修改推荐条件，在两个真实数据集上的实验证明，该方法可以在单步和多步批判中适应用户的偏好，是一种新型的无监督批判方法。

May, 2020