社交媒体投诉严重性建模

ACLMar, 2021

Modeling the Severity of Complaints in Social Media

Mali Jin, Nikolaos Aletras

TL;DR本篇论文是第一次在计算语言学领域研究投诉的严重程度等级，在公开数据集中加入四个严重程度等级并采用不同的基于 transformer 的网络结构和语言信息来训练模型，在二进制投诉检测和投诉严重程度等级多任务设置的联合模型中达到了最新的最优结果，最后提供了模型预测投诉严重等级的定性分析。

Abstract

The speech act of complaining is used by humans to communicate a negative mismatch between reality and expectations as a reaction to an unfavorable situation. Linguistic theory of pragmatics categorizes complaints into various →

complaints severity levels computational linguistics transformer-based networks multi-task setting

发现论文，激发创造

分析社交媒体上的投诉强度

本文是计算语言学领域中第一次尝试，旨在从文本中确定投诉的强度，并创建了包含 3,103 条微博发布的汉语数据集。本文发现可以通过计算模型准确地估计投诉强度，并证明了其可以提高社交媒体上帖子受欢迎程度的估计。

Apr, 2022

社交媒体中的投诉自动识别

本文针对社交媒体文本中的投诉行为进行了系统的语言学分析，基于 9 个领域的数据，使用多种基于特征和神经网络的机器学习模型，最终取得了最高 79F1 的预测性能，其结果可供相关机构或企业作为提升客户体验的依据。

Jun, 2019

基于 Transformer 网络的社交媒体投诉识别

本研究旨在探索使用最新预训练的神经语言模型与语言信息的组合来自动识别社交媒体投诉。我们评估了一系列以 transformer 网络为基础的神经网络模型，结果表明我们的模型在公开数据集上表现出色，F1 宏平均值高达 87。

Oct, 2020

社交媒体平台上基于投诉的推文识别的迭代方法

本文提出了一种迭代方法，可以识别与交通领域有关的投诉帖子，并进行全面评估和发布新数据集，以改进机构服务。

Jan, 2020

分析社交媒体上报告的网络安全威胁的感知严重性

本文研究了通过对互联网上描述网络威胁的语言进行分析来评估网络安全威胁的严重程度等方面的方法，并基于对软件漏洞的持重者的讨论，建立了自动分类器来判断软件漏洞的严重程度，从而提高了高严重性漏洞的精度，在此基础上，通过在线上记录的严重威胁漏洞的报告来预测真实世界的漏洞的利用。

Feb, 2019

口语客服对话中用户请求和抱怨的预测

该研究通过使用 HealthCall 数据集，评估了自动预测用户请求类型和检测投诉等两项客户关系管理任务，并探索了 14 种特征集作为输入。结果显示，语言特征总是提供最佳结果，并且 Wav2Vec 2.0 特征似乎比 ComPaRe16 特征更适用于这两项任务。嗓音互动特征在使用仅六个特征时在投诉任务上取得了 57% 的成果。

Jul, 2022

使用机器学习模型对社交媒体毒性评论进行分类

研究讨论了社交媒体平台上存在的有害评论问题，提出使用 Lstm-cnn 模型构建分类器，以高精度区分有毒和无毒评论，并帮助组织更好地检查评论区的有害性。

Apr, 2023

用于抑郁症程度估计的语义相似性模型

本文提出了一个有效的语义管道，基于社交媒体的写作，研究个体的抑郁症严重程度。通过计算方法，利用用户生成的社交媒体内容，本文探讨了不同聚合方法以准确预测用户症状严重程度，并在 Reddit 的两个基准测试中取得了 30％的提高。

Nov, 2022

语言属性的因果效应

本文提出了 TextCause 算法，使用观测数据估计语言属性的因果效应，解决了因果定量的形式化问题以及基于分类器和词库的噪声代理的偏差问题，该算法利用了 distant supervision 和预训练的 BERT 模型。

Oct, 2020

社交媒体吹嘘自动识别与分类

本研究通过大规模计算语言学的方式，评估了新的公开数据集以及注释为 “吹嘘” 的推特类型，同时通过不同的基于变压器的模型注入语言信息来评估二进制吹嘘分类和多类别吹嘘类型预测，并通过对数据进行实证研究，得出了该模型可以预测自吹自擂并进行语言和错误分析的结论。

Mar, 2022