ACLApr, 2024

多模态模型中的顺序组合泛化

TL;DR本研究通过研究多模态设置下的顺序组合泛化,检验了使用 CompAct(组合活动)数据集在丰富的自我中心厨房活动视频背景中。研究发现,双模态和三模态模型明显优于仅文本的对应模型,强调了多模态在未来研究中的重要性。