ChatGPT 在情感计算任务上的广泛评估

Aug, 2023

ChatGPT 在情感计算任务上的广泛评估

A Wide Evaluation of ChatGPT on Affective Computing Tasks

Mostafa M. Amin, Rui Mao, Erik Cambria, Björn W. Schuller

TL;DR基于 ChatGPT 模型的广泛研究评估了 GPT-4 和 GPT-3.5 在 13 个影响计算问题上的性能，发现它们在涉及情感、情绪和毒性等问题上表现出色，但在涉及隐性信号的问题上表现较差，如参与度测量和主观性检测。

Abstract

With the rise of foundation models, a new artificial intelligence paradigm has emerged, by simply using general purpose foundation models with prompting to solve problems instead of training a separate machine le

foundation models chatgpt affective computing gpt-4 gpt-3.5

发现论文，激发创造

情感计算是否将从基础模型和通用 AI 中崛起？对 ChatGPT 的首次评估

本文主要评估了 ChatGPT 在文本分类中的能力，尤其针对情感计算问题，实验结果显示，虽然 ChatGPT 表现良好，但相对于 RoBERTa 来说还有一个较大的提升空间。

Mar, 2023

ChatGPT 的回复能提升传统自然语言处理吗？

在本文中，研究人员探索了 ChatGPT 的新颖知识，在融合现有的自然语言处理技术时，如早期或晚期融合，增强了情感计算、自杀倾向检测和大五人格评估等问题的现有技术的能力。

Jul, 2023

关于 ChatGPT 在情感计算中的提示敏感性

通过敏感度分析和评估不同提示或生成参数对 foundation models 的性能敏感程度，探索 affective computing 领域中的 prompting 技术，以及对情感分析、毒性检测和讽刺检测等任务的性能影响。

Mar, 2024

大型语言模型中崭露细粒度情感处理能力

本文研究了大型语言模型（尤其是生成预训练变压器）在各种语言相关任务上显示出的令人印象深刻的结果。我们探索了 ChatGPT 仅通过提示就能够执行情感计算任务的零点能力。我们显示 ChatGPT a）能够在价值、唤起和支配维度上执行有意义的情绪分析，b）在情绪类别和这些情感维度方面具有有意义的情感表示，以及 c）可以根据基于提示的 OCC 评估模型的计算实现，对情况进行基本的评估引发情绪的操作。这些发现具有很高的相关性：首先，它们表明解决复杂的情感处理任务的能力源于对广泛数据集进行基于语言的标记预测的训练。其次，它们显示了大型语言模型模拟、处理和分析人类情绪的潜力，这对于诸如情感分析、社交互动代理和社交机器人等各种应用具有重要意义。

Sep, 2023

GPTEval: ChatGPT 和 GPT-4 评估调查

对 ChatGPT 和 GPT-4 的语言能力、科学知识和伦理考虑进行全面评估的研究，包括现有评估方法的探讨和未来研究中对大型语言模型的评估建议。

Aug, 2023

GPT 作为心理学家？关于 GPT-4V 在视觉情感计算中的初步评估

Multimodal language models (MLMs) are applied in affective computing, evaluating their performance in facial action unit recognition, micro-expression detection, and emotion recognition, highlighting challenges and potential for further study in this field.

Mar, 2024

聊天 GPT 与情感增强提示在心理健康分析中的评估

本文详细评估了 ChatGPT 在 11 个数据集上的心理健康分析和情感推理能力，分析了不同提示策略对其分析能力和可解释性的影响，并发现情感提示可以有效提高其性能，但需要正确的情感注入方式。

Apr, 2023

ChatGPT 在情感分析中的表现如何？初步研究

本文通过标准测试、极性转移测试、开放域测试和情感推理测试等方法，对 ChatGPT 在理解文本中的意见、情感和情绪方面进行了初步评估，并与 Fine-tuned BERT 和现有的端到端情感分析模型进行了比较，并进行了人工评估和定性分析。

Apr, 2023

ChatGPT 是否具备情感对话能力？

本研究基于由 OpenAI 研发的先进语言模型 ChatGPT，探讨了其情感对话能力。研究通过一系列下游任务实验，评估了 ChatGPT 在情感对话理解和生成方面的表现，并发现虽然 ChatGPT 在情感对话理解方面的性能仍然存在问题，但在生成情感回应方面表现良好。此外，本研究还提出了未来研究方向的可能性。

Apr, 2023

ChatGPT：全才，非专才

本文研究了 ChatGPT 在 25 个多样化的自然语言处理任务（如情感分析、情感识别、态度检测、自然语言推断、词义消歧、语言可接受性和问答）中的表现及其个性化响应能力，并与现有的国际先进水平（SOTA）解决方案进行了比较。结果表明，任务难度越高（低 SOTA 表现），ChatGPT 的损失越大。同时也揭示了 ChatGPT 偏见，在一定程度上限制了 ChatGPT 的有效性。

Feb, 2023