BriefGPT.xyz
Sep, 2024
情感女王:评估大型语言模型同理心的基准
EmotionQueen: A Benchmark for Evaluating Empathy of Large Language Models
HTML
PDF
Yuyan Chen, Hao Wang, Songzhou Yan, Sijia Liu, Yueze Li...
TL;DR
本研究针对现有情感分析研究不足以全面评估大型语言模型(LLM)情感智能的问题,提出了一个名为“情感女王”的新框架。该框架通过四个独特任务评估LLM的情感智能,并设计了两项评估指标来衡量其在情感识别和回应能力上的表现。实验结果显著揭示了LLM在情感智能方面的能力和局限性。
Abstract
Emotional Intelligence
in
Large Language Models
(LLMs) is of great importance in
Natural Language Processing
. However, the previous resear
→