Feb, 2024

EFUF:用于减轻多模态大语言模型中幻觉的高效细粒度遗忘框架

TL;DR多模式大语言模型 (MLLMs) 在过去几年中引起了越来越多的关注,但它们可能会生成包含图片中不存在的对象的描述,这被称为对象幻觉。为了消除幻觉,已有的方法手动注释带有和不带幻觉的成对响应,然后采用各种对齐算法改进图像和文本之间的对齐能力。然而,它们在微调阶段需要大量计算资源,并且需要昂贵的人工注释来构建对齐算法所需的成对数据,这些问题可以通过借鉴遗忘思想和提出一种高效的精细遗忘框架 (EFUF) 来解决,该框架无需成对数据即可消除幻觉。广泛的实验证明我们的方法在保留适度计算开销的同时一致降低了幻觉,同时保持了生成质量。我们的代码和数据集将公开提供。