Jan, 2025

面向人工智能对齐和情感分析的新基准:在AGI背景下人类与大型语言模型的比较研究

TL;DR本研究旨在建立一个评估大型语言模型在社会重要问题上的情感基准,以填补对AI系统对人类长期影响的研究空白。采用Likert量表调查,对包括GPT-4和Bard在内的七个大型语言模型进行分析,并与三个人类样本的情感数据进行了比较。研究发现,LLMs的情感得分存在显著差异,而GPT-4在对AGI的情感上表现出最积极的态度,反映出LLMs在情感形成中可能存在的利益冲突和偏见问题。