Jun, 2024

大型语言模型中评估态度、观点和价值的潜力与挑战

TL;DR近年来,大型语言模型(LLMs)的最新进展引发了人们对验证和理解 LLMs 可能具有的类人认知行为特质(Attitudes,Opinions,Values)的广泛兴趣。然而,测量嵌入在 LLMs 中的 AOV 仍然模糊不清,不同的评估方法可能得出不同的结果。本文旨在通过概述最近对 LLMs 中 AOV 评估的研究工作来弥合这一差距。此外,我们还调查了这些研究工作中评估流程不同阶段的相关方法。通过这样做,我们解决了了解模型、人工智能与人类的协同以及在社会科学中的下游应用方面的潜力与挑战。最后,我们提供了对评估方法、模型改进和跨学科合作的实际见解,从而为评估 LLMs 中的 AOV 的不断发展的领域做出贡献。