ChatGPT 在情感计算任务上的广泛评估
本文主要评估了 ChatGPT 在文本分类中的能力,尤其针对情感计算问题,实验结果显示,虽然 ChatGPT 表现良好,但相对于 RoBERTa 来说还有一个较大的提升空间。
Mar, 2023
在本文中,研究人员探索了 ChatGPT 的新颖知识,在融合现有的自然语言处理技术时,如早期或晚期融合,增强了情感计算、自杀倾向检测和大五人格评估等问题的现有技术的能力。
Jul, 2023
通过敏感度分析和评估不同提示或生成参数对 foundation models 的性能敏感程度,探索 affective computing 领域中的 prompting 技术,以及对情感分析、毒性检测和讽刺检测等任务的性能影响。
Mar, 2024
本文研究了大型语言模型(尤其是生成预训练变压器)在各种语言相关任务上显示出的令人印象深刻的结果。我们探索了 ChatGPT 仅通过提示就能够执行情感计算任务的零点能力。我们显示 ChatGPT a)能够在价值、唤起和支配维度上执行有意义的情绪分析,b)在情绪类别和这些情感维度方面具有有意义的情感表示,以及 c)可以根据基于提示的 OCC 评估模型的计算实现,对情况进行基本的评估引发情绪的操作。这些发现具有很高的相关性:首先,它们表明解决复杂的情感处理任务的能力源于对广泛数据集进行基于语言的标记预测的训练。其次,它们显示了大型语言模型模拟、处理和分析人类情绪的潜力,这对于诸如情感分析、社交互动代理和社交机器人等各种应用具有重要意义。
Sep, 2023
对 ChatGPT 和 GPT-4 的语言能力、科学知识和伦理考虑进行全面评估的研究,包括现有评估方法的探讨和未来研究中对大型语言模型的评估建议。
Aug, 2023
Multimodal language models (MLMs) are applied in affective computing, evaluating their performance in facial action unit recognition, micro-expression detection, and emotion recognition, highlighting challenges and potential for further study in this field.
Mar, 2024
本文详细评估了 ChatGPT 在 11 个数据集上的心理健康分析和情感推理能力,分析了不同提示策略对其分析能力和可解释性的影响,并发现情感提示可以有效提高其性能,但需要正确的情感注入方式。
Apr, 2023
本文通过标准测试、极性转移测试、开放域测试和情感推理测试等方法,对 ChatGPT 在理解文本中的意见、情感和情绪方面进行了初步评估,并与 Fine-tuned BERT 和现有的端到端情感分析模型进行了比较,并进行了人工评估和定性分析。
Apr, 2023
本研究基于由 OpenAI 研发的先进语言模型 ChatGPT,探讨了其情感对话能力。研究通过一系列下游任务实验,评估了 ChatGPT 在情感对话理解和生成方面的表现,并发现虽然 ChatGPT 在情感对话理解方面的性能仍然存在问题,但在生成情感回应方面表现良好。此外,本研究还提出了未来研究方向的可能性。
Apr, 2023
本文研究了 ChatGPT 在 25 个多样化的自然语言处理任务(如情感分析、情感识别、态度检测、自然语言推断、词义消歧、语言可接受性和问答)中的表现及其个性化响应能力,并与现有的国际先进水平(SOTA)解决方案进行了比较。结果表明,任务难度越高(低 SOTA 表现),ChatGPT 的损失越大。同时也揭示了 ChatGPT 偏见,在一定程度上限制了 ChatGPT 的有效性。
Feb, 2023