Dec, 2023

See, Say, and Segment: 教导 LMMs 克服错误先决条件

TL;DR通过级联和联合训练方法,我们提出了一种大型多模态模型(LMMs)的解决方案,可以在图像中检测物体是否存在,并通过提供自然语言反馈和修正查询中的语义错误来改善物体分割的结果。此外,我们还引入了一个新的虚假前提修正基准数据集,通过在虚假前提条件下相对于基准模型提高超过 31% 的相对交并比(cIOU)值来检测虚假前提。