Nov, 2023

FETV:开放领域文本视频生成的细粒度评估基准

TL;DR我们提出了 FETV,一个用于细粒度评估文本到视频生成的基准,它基于三个正交方面对提示进行分类,并且是与时间相关的,通过该基准我们对四个代表性的 T2V 模型进行了全面的手动评估,发现现有的自动评估指标与人工评估的相关性较差,并提出了两个新的自动评估指标与人工评估相关性更高。