社交媒体投诉严重性建模
本文是计算语言学领域中第一次尝试,旨在从文本中确定投诉的强度,并创建了包含 3,103 条微博发布的汉语数据集。本文发现可以通过计算模型准确地估计投诉强度,并证明了其可以提高社交媒体上帖子受欢迎程度的估计。
Apr, 2022
本文针对社交媒体文本中的投诉行为进行了系统的语言学分析,基于 9 个领域的数据,使用多种基于特征和神经网络的机器学习模型,最终取得了最高 79F1 的预测性能,其结果可供相关机构或企业作为提升客户体验的依据。
Jun, 2019
本研究旨在探索使用最新预训练的神经语言模型与语言信息的组合来自动识别社交媒体投诉。我们评估了一系列以 transformer 网络为基础的神经网络模型,结果表明我们的模型在公开数据集上表现出色,F1 宏平均值高达 87。
Oct, 2020
本文研究了通过对互联网上描述网络威胁的语言进行分析来评估网络安全威胁的严重程度等方面的方法,并基于对软件漏洞的持重者的讨论,建立了自动分类器来判断软件漏洞的严重程度,从而提高了高严重性漏洞的精度,在此基础上,通过在线上记录的严重威胁漏洞的报告来预测真实世界的漏洞的利用。
Feb, 2019
该研究通过使用 HealthCall 数据集,评估了自动预测用户请求类型和检测投诉等两项客户关系管理任务,并探索了 14 种特征集作为输入。结果显示,语言特征总是提供最佳结果,并且 Wav2Vec 2.0 特征似乎比 ComPaRe16 特征更适用于这两项任务。嗓音互动特征在使用仅六个特征时在投诉任务上取得了 57% 的成果。
Jul, 2022
研究讨论了社交媒体平台上存在的有害评论问题,提出使用 Lstm-cnn 模型构建分类器,以高精度区分有毒和无毒评论,并帮助组织更好地检查评论区的有害性。
Apr, 2023
本文提出了一个有效的语义管道,基于社交媒体的写作,研究个体的抑郁症严重程度。通过计算方法,利用用户生成的社交媒体内容,本文探讨了不同聚合方法以准确预测用户症状严重程度,并在 Reddit 的两个基准测试中取得了 30%的提高。
Nov, 2022
本文提出了 TextCause 算法,使用观测数据估计语言属性的因果效应,解决了因果定量的形式化问题以及基于分类器和词库的噪声代理的偏差问题,该算法利用了 distant supervision 和预训练的 BERT 模型。
Oct, 2020
本研究通过大规模计算语言学的方式,评估了新的公开数据集以及注释为 “吹嘘” 的推特类型,同时通过不同的基于变压器的模型注入语言信息来评估二进制吹嘘分类和多类别吹嘘类型预测,并通过对数据进行实证研究,得出了该模型可以预测自吹自擂并进行语言和错误分析的结论。
Mar, 2022