Nov, 2024

HyperGLM:用于视频场景图生成与预测的超图

TL;DR本研究解决了现有视频场景图生成方法在处理复杂多对象互动和推理方面的不足。提出的HyperGLM通过构建统一的场景超图,促进多向互动和高阶关系的推理。实验表明,HyperGLM在五项任务中均超越了当前最先进的方法,为视频场景理解提供了更有效的解决方案。