Feb, 2024

OSCaR:对象状态字幕和状态变化表示

TL;DR通过介绍 Object State Captioning and State Change Representation (OSCaR) 数据集和基准测试,本文旨在解决智能模型在理解和推测物体状态变化方面的挑战,提出了一种新的评估多模态大型语言模型 (MLLMs) 的方法,并表明现有的模型在理解这些变化方面仍需要进一步改进。