Feb, 2024
SCO-VIST: 基于社交互动常识知识的视觉叙事
SCO-VIST: Social Interaction Commonsense Knowledge-based Visual Storytelling
Eileen Wang, Soyeon Caren Han, Josiah Poon
TL;DRSCO-VIST 框架使用图表示形式,结合语义和基于发生的边权重,通过 Floyd-Warshall 算法生成视觉叙事。在多个指标上,该框架在视觉根植性、连贯性、多样性和人性上优于其他模型,经过自动和人工评估。