Jan, 2024

ChatGPT 与 Gemini 与 LLaMA 在多语言情感分析中的比较

TL;DR使用大型语言模型(LLM)的自动情感分析在学术研究和工业应用中越来越普遍,但在处理模糊或讽刺文本的性能评估和验证方面仍不够完善。本研究构建了细致和模糊的场景,将其翻译成 10 种语言,并使用流行的 LLM 预测其关联的情感。结果经过后续人为响应的验证。ChatGPT 和 Gemini 通常能够很好地处理模糊场景,但我们也发现了在不同模型和评估的人类语言之间存在显著偏见和不一致的性能。本研究提供了自动情感分析评估的标准化方法,并呼吁进一步改进算法和其基础数据,以提高其性能、可解释性和适用性。