ChatGPT 在情感分析中的表现如何？初步研究

Apr, 2023

ChatGPT 在情感分析中的表现如何？初步研究

Is ChatGPT a Good Sentiment Analyzer? A Preliminary Study

Zengzhi Wang, Qiming Xie, Zixiang Ding, Yi Feng, Rui Xia

TL;DR本文通过标准测试、极性转移测试、开放域测试和情感推理测试等方法，对 ChatGPT 在理解文本中的意见、情感和情绪方面进行了初步评估，并与 Fine-tuned BERT 和现有的端到端情感分析模型进行了比较，并进行了人工评估和定性分析。

Abstract

Recently, chatgpt has drawn great attention from both the research community and the public. We are particularly curious about whether it can serve as a universal sentiment analyzer. To this end, in this work, we

chatgpt sentiment analyzer evaluation opinions sentiments

发现论文，激发创造

利用 ChatGPT 作为文本标注工具进行情感分析

本研究探讨了 ChatGPT 作为数据标记工具用于不同情感分析任务中的应用，结果表明相较于基于词汇表的算法，ChatGPT 在准确性方面有了显著提高，可用于不同的事件和任务情感分析的标注工作。

Jun, 2023

ChatGPT 是一种好的 NLG 评估器吗？初步研究

研究通过在三个常用的 NLG 元评估数据集上实验，评估 ChatGPT 作为 NLG 指标的可靠性，结果表明其与黄金人类判断的相关性达到了同类指标的最高水平或具有竞争性。

Mar, 2023

ChatGPT 情绪识别中的偏见

本技术报告探讨了 ChatGPT 在从文本中识别情感方面的能力，这可以作为交互式聊天机器人、数据注释和心理健康分析等各种应用的基础。通过实验证明了 ChatGPT 在情感识别方面具有合理的可重复性，通过微调可以明显提高其性能。然而，性能会随不同的情感标签和数据集而异，突显了固有的不稳定性和潜在的偏差。数据集和情感标签的选择对 ChatGPT 的情感识别性能具有显著影响。本文阐明了数据集和标签选择的重要性，以及通过微调提高 ChatGPT 情感识别能力的潜力，为使用 ChatGPT 的应用程序中更好地整合情感分析奠定了基础。

Oct, 2023

ChatGPT 在情感计算任务上的广泛评估

基于 ChatGPT 模型的广泛研究评估了 GPT-4 和 GPT-3.5 在 13 个影响计算问题上的性能，发现它们在涉及情感、情绪和毒性等问题上表现出色，但在涉及隐性信号的问题上表现较差，如参与度测量和主观性检测。

Aug, 2023

GPTEval: ChatGPT 和 GPT-4 评估调查

对 ChatGPT 和 GPT-4 的语言能力、科学知识和伦理考虑进行全面评估的研究，包括现有评估方法的探讨和未来研究中对大型语言模型的评估建议。

Aug, 2023

使用 ChatGPT 改进金融领域的情感分析

使用大型语言模型 ChatGPT 3.5 进行金融情感分析，特别关注外汇市场，通过零样本提示方法的探究，比起金融文本情感分析模型 FinBERT，ChatGPT 表现出了大约 35% 的情感分类性能提升以及 36% 更高的与市场回报的相关性，强调了提示工程在零样本上下文中的重要性，突显了 ChatGPT 在金融应用中显著提升情感分析的潜力，并分享所使用的数据集以促进该领域的进一步研究与发展。

Aug, 2023

ChatGPT 在提取方面 - 类别 - 观点 - 情感四元组方面的局限性：比较分析

ChatGPT 在方面情感分析中，通过专门的提示模板和少样本学习方法，实现了复杂的四元组提取任务，并在四个公共数据集上与现有最先进模型进行了比较评估，揭示了 ChatGPT 在四元组提取方面的能力边界。

Oct, 2023

ChatGPT 和 Fine-tuned BERT 的比较研究

本研究评估了 ChatGPT 对最流行的 GLUE 基准的理解能力，并与 4 个代表性的 fine-tuned 的 BERT 模型进行比较。我们发现，ChatGPT 在处理释义和相似性任务方面存在不足，但在推理任务方面优于所有 BERT 模型，并在情感分析和问答任务上表现与 BERT 相当。此外，通过组合一些高级提示策略，我们展示了 ChatGPT 的理解能力可以进一步提高。

Feb, 2023

ChatGPT 在基准数据集上的系统研究和综合评估

本文通过评估 ChatGPT 在各种自然语言处理任务中的表现，旨在验证其优缺点，并为未来的 LLM 研究提供思路。作者发现 ChatGPT 能够完成多种任务，取得很好的表现，但仍有许多难题需要解决。

May, 2023

ChatGPT：2.5 个月后的 Meta 分析

本文通过分析超过 30 万条推文和 150 多篇学术论文，探究了 OpenAI 开发的聊天机器人 ChatGPT 在社交网络和学术领域中的感知和讨论，发现 ChatGPT 在社交网络中普遍被认为是高质量的，但随着时间的推移，快乐情绪略有下降。在学术论文中，ChatGPT 被认为是道德伦理和教育领域中伦理威胁和机会的同时存在，同时被认为在医疗领域具有重大机遇，聚焦当前的 ChatGPT 感知对未来的发展具有启示作用。

Feb, 2023