Feb, 2024

LangXAI: 整合大型视觉模型生成文本解释以提高视觉感知任务的可解释性

TL;DRLangXAI 是一个框架,将可解释的人工智能 (XAI) 与先进的视觉模型相结合,为视觉识别任务生成文本解释。通过为最终用户提供分类、目标检测和语义分割模型输出的基于文本的解释,LangXAI 填补了人工智能和计算机视觉领域知识有限的最终用户的理解差距。初步结果表明,LangXAI 具有更高的 BERT 分数,增强了其可信度和透明度,为最终用户提供了一个更加透明可靠的视觉任务的人工智能框架。