GPT 是情感的计算模型吗?详细分析
基于 ChatGPT 模型的广泛研究评估了 GPT-4 和 GPT-3.5 在 13 个影响计算问题上的性能,发现它们在涉及情感、情绪和毒性等问题上表现出色,但在涉及隐性信号的问题上表现较差,如参与度测量和主观性检测。
Aug, 2023
GPT-4 可以进行情感预测和情感强度的操纵,以及通过反向评估进行目标、信念和情感的预测。然而,它不能完全取代试图建模情感相关过程的作品,尽管语言模型在情感建模中有重要作用。
Oct, 2023
Multimodal language models (MLMs) are applied in affective computing, evaluating their performance in facial action unit recognition, micro-expression detection, and emotion recognition, highlighting challenges and potential for further study in this field.
Mar, 2024
本文研究了大型语言模型(尤其是生成预训练变压器)在各种语言相关任务上显示出的令人印象深刻的结果。我们探索了 ChatGPT 仅通过提示就能够执行情感计算任务的零点能力。我们显示 ChatGPT a)能够在价值、唤起和支配维度上执行有意义的情绪分析,b)在情绪类别和这些情感维度方面具有有意义的情感表示,以及 c)可以根据基于提示的 OCC 评估模型的计算实现,对情况进行基本的评估引发情绪的操作。这些发现具有很高的相关性:首先,它们表明解决复杂的情感处理任务的能力源于对广泛数据集进行基于语言的标记预测的训练。其次,它们显示了大型语言模型模拟、处理和分析人类情绪的潜力,这对于诸如情感分析、社交互动代理和社交机器人等各种应用具有重要意义。
Sep, 2023
通过对大型语言模型的实验,研究表明情绪对其行为的决策和人类决策的关联存在重要影响,其中 GPT-4 在情绪状态下表现出与人类类似的行为响应。
Jun, 2024
研究论文通过对 ChatGPT 及其最新版本 GPT-4 与人类生成的情感场景回应能力进行比较,探究了 ChatGPT 在回应不同情绪场景(正面和负面)时的共情水平。研究采用一项涉及 600 名参与者的组间研究来评估 ChatGPT 和人类生成的回应的共情程度。研究发现,ChatGPT 所生成的回应的平均共情评分比人类生成的回应高出约 10%。此外,明确要求 ChatGPT 在回应中融入对共情认知、情感和同情的明确理解,使其回应与具有较高共情度的个体的期望更为接近,相比之下,人类回应的一致性要小 5 倍。该研究提出的评估框架可用于评估较大的语言模型的共情能力,并且具有可扩展性和适应性,避免了未来研究中重复当前研究结果的需要。
Feb, 2024
本研究基于由 OpenAI 研发的先进语言模型 ChatGPT,探讨了其情感对话能力。研究通过一系列下游任务实验,评估了 ChatGPT 在情感对话理解和生成方面的表现,并发现虽然 ChatGPT 在情感对话理解方面的性能仍然存在问题,但在生成情感回应方面表现良好。此外,本研究还提出了未来研究方向的可能性。
Apr, 2023
本研究旨在探索 GPT-3.5 作为大型语言模型在处理互联网迷因情感分析方面的能力,包括迷因情感分类、幽默类型确定和隐性仇恨迷因检测。评估结果表明,尽管 GPT 取得了显著进展,但仍然面临内在限制,包括对上下文的理解、隐含含义的解释和数据偏见等。该研究对 AI 在处理复杂的、依赖上下文的任务方面的适用性进行了探讨,为未来的发展提供了有价值的见解。
Nov, 2023
本文详细评估了 ChatGPT 在 11 个数据集上的心理健康分析和情感推理能力,分析了不同提示策略对其分析能力和可解释性的影响,并发现情感提示可以有效提高其性能,但需要正确的情感注入方式。
Apr, 2023