Apr, 2024

解开人工智能错误之谜:探索大型语言模型的人工和机器解释的有效性

TL;DR本研究通过与最新方法(集成渐变、保守 LRP 和 ChatGPT)进行对比实证调查,收集和分析了 156 个人生成的文本和基于显著性的解释,并发现与机器显著性图相比,人工显著性图尤其在解释人工智能结果时更具说明性,但其性能与对人工智能模型和解释的信任负相关,揭示了人工智能解释中的困境:当有助于理解错误的人工智能预测时,会降低任务表现。