Oct, 2024

通过大型语言模型评估解释:超越传统用户研究

TL;DR本研究解决了传统用户研究在评估可解释人工智能工具方面成本高、耗时长、难以扩展的问题。我们提出利用大型语言模型(LLMs)替代人类参与者,进行关于对照和因果解释的比较研究。研究发现LLMs能够有效再现原研究的主要结论,且在可扩展性和成本效益方面展现出潜力,为定性可解释人工智能评估提供了一种新的解决方案。