社交媒体中的投诉自动识别
本研究旨在探索使用最新预训练的神经语言模型与语言信息的组合来自动识别社交媒体投诉。我们评估了一系列以 transformer 网络为基础的神经网络模型,结果表明我们的模型在公开数据集上表现出色,F1 宏平均值高达 87。
Oct, 2020
本文是计算语言学领域中第一次尝试,旨在从文本中确定投诉的强度,并创建了包含 3,103 条微博发布的汉语数据集。本文发现可以通过计算模型准确地估计投诉强度,并证明了其可以提高社交媒体上帖子受欢迎程度的估计。
Apr, 2022
本篇论文是第一次在计算语言学领域研究投诉的严重程度等级,在公开数据集中加入四个严重程度等级并采用不同的基于 transformer 的网络结构和语言信息来训练模型,在二进制投诉检测和投诉严重程度等级多任务设置的联合模型中达到了最新的最优结果,最后提供了模型预测投诉严重等级的定性分析。
Mar, 2021
本研究通过大规模计算语言学的方式,评估了新的公开数据集以及注释为 “吹嘘” 的推特类型,同时通过不同的基于变压器的模型注入语言信息来评估二进制吹嘘分类和多类别吹嘘类型预测,并通过对数据进行实证研究,得出了该模型可以预测自吹自擂并进行语言和错误分析的结论。
Mar, 2022
该研究通过使用 HealthCall 数据集,评估了自动预测用户请求类型和检测投诉等两项客户关系管理任务,并探索了 14 种特征集作为输入。结果显示,语言特征总是提供最佳结果,并且 Wav2Vec 2.0 特征似乎比 ComPaRe16 特征更适用于这两项任务。嗓音互动特征在使用仅六个特征时在投诉任务上取得了 57% 的成果。
Jul, 2022
我们开发了一种基于自然语言处理的程序,用于检测消费者投诉中的系统性非可取行为,称为系统性异常,而不是检测重大异常,对于小型和频繁的系统性异常,由于各种原因,包括技术原因和人为分析师的自然限制,算法可能会失效。因此,在分类之后的下一步,我们将投诉描述转换为定量数据,然后使用一种检测系统性异常的算法进行分析。我们使用消费者金融保护局的消费者投诉数据库中的投诉描述来说明整个过程。
Aug, 2023
本文通过对 Hateval 语料库进行人工标注并评估,探讨了大型语言模型中关于憎恨言论的论述元素自动识别的可靠性,发现某些元素相对可靠,对于那些错误率较高的元素,其争议点分析和适当调整后能够更为可靠的识别。
Jun, 2023
通过使用自我标记的群体进行有组织在线仇恨言论和反言论,研究使用集成学习算法识别有组织在线仇恨言论和反言论,发现自动化方法在评估社交媒体上协调反言论对稳定对话的影响的潜力。
Jun, 2020
本文对社交媒体上仇恨言论检测和追踪的问题进行了系统综述,重点关注自然语言处理和深度学习技术,概述了该领域的文献、方法和限制,并提出未来研究方向。
May, 2021