Oct, 2023

GROOViST:一种视觉叙事中对物体进行定位的度量

TL;DR该论文提出了一种评估图像序列生成的故事质量的方法,并针对视觉扎根度进行了分析和度量,提出了一种模块化设计的评估工具 GROOViST,该工具考虑了跨模态依赖、时间错位以及人类感知对视觉扎根度的影响。