基于文本的情感自动分类:不同数据集的比较探索
使用深度学习技术和 BERT 文本嵌入方法,对来自资源匮乏语言的有限文本数据集进行情感识别的研究,通过介绍 SmallEnglishEmotions 数据集验证了这些方法在准确分类数据集中的优越性。
Feb, 2024
本研究探讨了基于 Transformer 模型在文本数据情感分类上的应用。我们训练和评估了几种预训练 Transformer 模型,并对 Transformer 层的微调、可训练性以及文本数据预处理等因素进行了分析。我们的分析发现,常用的技术,如去除标点符号和停用词,可能会影响模型的性能。这可能是因为 Transformer 模型的优势在于理解文本中的上下文关系,而标点符号和停用词仍然可以传达情感或强调,去除它们可能会破坏这种上下文。
Mar, 2024
文本情感检测研究综述表明,虽然目前已经有许多技术、方法和模型来检测文本中的情感表达,但人类情感的复杂性以及使用隐喻性语言等因素使得这些方法不足以应对这些复杂性,因此需要关注情感表达的语言细节。
Jun, 2018
本文介绍了机器学习在情感分析领域的最新进展,并对情感分析的起源、任务、挑战、方法和资源使用以及应用进行了概述。此外,文中还讨论了情感分析存在潜在有害影响的问题,并介绍了追求情感分析公平性的最新研究方向。
May, 2020
本研究综合评述了 150 多种基于深度学习的文本分类模型,包括情感分析,新闻分类,问答和自然语言推理,并讨论了它们的技术贡献、相似性和优势,同时提供了 40 多个流行数据集的概述。最后,我们对不同深度学习模型在流行基准测试上的性能进行了定量分析,并讨论了未来的研究方向。
Apr, 2020
本篇论文提出利用基于 LSTM 的深度学习模型来检测文本对话中的情绪,讨论了利用语义和情感嵌入的半自动化技术来收集训练数据以及结合方案,该方法在真实场景下的表现优于传统机器学习基准线和其他现成的深度学习模型。
Jul, 2017
本研究利用 GoEmotions 和 Vent 两个情感分类的大型数据集,通过多种特征空间和学习算法设计了一个基准测试,并在 BERT 基础上提出了两个简单却有效的模型,超过了先前的强基线。通过人体实验分析了作家表达情感和读者感知情感之间的差异,证明了作家表达的情感更难被识别。研究者可以通过我们提供的公共网络界面来研究我们的模型。
Sep, 2021
情感识别在文本中,识别诸如喜悦或愤怒之类的情感,是 NLP 中的一个具有挑战性的问题,其中一个挑战是缺乏已注释有情感的可用数据集。本研究研究了数据增强技术对小规模不平衡数据集的影响,并且证实使用增强数据训练分类器模型可以显著改进情感识别性能。
Oct, 2023
研究使用传统机器学习技术和深度神经网络模型在社交媒体文本数据中识别情绪,并构建一个双向长短记忆神经网络(BiLSTM)和双向门循环单元(BiGRU)的集成模型,其中 BiGRU 模型表现最佳,准确率达 87.53%。此结果将有助于开发一个可视化情绪波动的决策工具。
Feb, 2023
本研究旨在通过深度学习和转移学习来提高情感计算中文段落情感识别精度。我们使用改进后的循环神经网络模型,并提出 Sent2affect 模型进行迁移学习。实验结果表明,我们的模型在 6 个基准数据集上表现出色,相对于传统机器学习方法有了显著提升。这些发现对情感计算的应用具有重要的启示意义。
Mar, 2018