Feb, 2024

多模式摘要的细粒度和可解释性事实评估

TL;DR多模态概括旨在根据文本和图像生成简洁的摘要,但现有方法潜在地存在不实输出。为了评估多模态概括模型的真实性,我们提出了两个细粒度且可解释的评估框架(FALLACIOUS),用于不同的应用场景,即基于参考物的真实性评估框架和基于非参考物的真实性评估框架。值得注意的是,基于非参考物的真实性评估框架不需要基准真实性,因此具有更广泛的应用场景。为了评估提出框架的有效性,我们计算了其与其他度量标准之间的相关性。实验结果显示了我们提出方法的有效性。我们将通过 Github 发布我们的代码和数据集。