Sep, 2022

Visual Recipe Flow:一份用于学习物体视觉状态变化的食谱流数据集

TL;DR提出了一个名为Visual Recipe Flow的多模态数据集,它能够学习菜谱文本中每个烹饪动作的结果,该数据集由物体状态变化以及菜谱文本的工作流程组成,其使用一个菜谱流程图来表示工作流程并使用图像对来表示状态变化,可用于多模态常识推理和过程文本生成等应用。