情感分析建模:LLMs 和数据增强技术
在金融情感分析领域,传统的 NLP 模型受到参数大小和训练数据范围的限制,以及简洁的财经新闻文本缺乏上下文的问题,而无法很好地泛化和提高准确性。为了解决这些挑战,本研究引入了一种基于检索增强的大型语言模型(LLMs)框架,该框架包括一个指导调整的 LLMs 模块和一个从可靠外部来源检索附加上下文的模块。与传统模型和 ChatGPT、LLaMA 等 LLMs 相比,我们的方法在准确性和 F1 得分方面取得了 15%到 48%的性能提升。
Oct, 2023
金融情感分析是将金融文本内容分类为情感类别(如积极、消极和中性)。本文聚焦于金融新闻标题的分类,通过利用预训练的大型语言模型以及监督微调技术,实现在少量训练样本情况下显著超越之前最先进的算法。
Jan, 2024
本文讨论了大型语言模型在情感分析任务中的有效性,对 13 项不同的任务进行了评估,在简单任务中表现良好,但在涉及更深层次理解和结构化情感信息方面仍有待提高;然而,在资源有限的情况下,大型语言模型表现出色,提供了潜在可能性。该研究提出了一个新的基准评估框架 SentiEval。
May, 2023
在跨语言情感分析领域,公共的小型多语言语言模型在零样本跨语言性能上优于大型通用语言模型,但在少样本跨语言设置中,公共的大型通用语言模型展现出更高的适应潜力。
Jun, 2024
本文通过在六个不同的基准上比较多个模型,展示了 Bi-LSTMs 在不同数据集上都有出色表现,并说明 LSTMs 和 Bi-LSTMs 对于多分类细粒度情感任务非常适用。此外,文章还指出,在训练过程中将情感信息融入词嵌入向量可以显著提高与训练数据相似的数据集的效果,有效促进了不同模型结构在不同数据集上的性能的理解和研究。
Sep, 2017
该研究提供了一个严谨和全面的基准以及一个标准化的回测框架,以客观评估各种类型的 LLM 在从中国新闻文本数据中提取情感因子方面的有效性,从而支持大规模语言模型在量化交易策略中的应用。
Jun, 2023
本研究提出了使用句子级别注释训练的简单模型,同时采用正则化方法,以模拟情感词汇、否定词和强度词汇的语言学角色,从而生成语言学相关的表示形式,并且能够捕捉情感、否定和强度词汇的情感转移效应,同时在不损失模型简洁性的前提下获得竞争性的结果。
Nov, 2016
该论文介绍了一种用于情感分析的多 LLM 协商框架,其中包括一个推理注入生成器来提供决策及其理由,以及一个评估生成器可信度的解释推导鉴别器,通过迭代使生成器和鉴别器达成一致,从而解决了情感分析中的单一决策缺陷的问题。实验证明,该方法在各种情感分析基准上表现出更好的性能。
Nov, 2023
与传统情感分析相比,多模态情感分析需要同时考虑来自多模态源的情感信号,它更符合人类在现实场景中处理情感的方式。本文综述了近期文本为中心的多模态情感分析任务中的研究,审视了大型语言模型在文本为中心的多模态情感分析中的潜力、方法、优势和局限性,总结了基于大型语言模型的多模态情感分析技术的应用场景,并探讨了未来多模态情感分析的挑战和潜在研究方向。
Jun, 2024
我们评估了多种模型,包括传统机器学习模型、预训练语言模型和大型语言模型,比较它们在社交媒体健康相关自然语言处理任务中的性能。实验结果表明,使用大型语言模型进行数据增强可以获得比仅使用人工标注数据训练的模型更好的结果,并且传统的有监督学习模型在零样本设置中也表现出优于大型语言模型的性能。
Mar, 2024