Jun, 2024
大型语言模型中评估态度、观点和价值的潜力与挑战
The Potential and Challenges of Evaluating Attitudes, Opinions, and
Values in Large Language Models
TL;DR近年来,大型语言模型(LLMs)的最新进展引发了人们对验证和理解LLMs可能具有的类人认知行为特质(Attitudes,Opinions,Values)的广泛兴趣。然而,测量嵌入在LLMs中的AOV仍然模糊不清,不同的评估方法可能得出不同的结果。本文旨在通过概述最近对LLMs中AOV评估的研究工作来弥合这一差距。此外,我们还调查了这些研究工作中评估流程不同阶段的相关方法。通过这样做,我们解决了了解模型、人工智能与人类的协同以及在社会科学中的下游应用方面的潜力与挑战。最后,我们提供了对评估方法、模型改进和跨学科合作的实际见解,从而为评估LLMs中的AOV的不断发展的领域做出贡献。