Jun, 2023

多标签元加权长尾动态场景图生成

TL;DR本文研究了视频场景图生成中主题和对象之间语义关系的问题,提出了一种多标签元学习框架以处理偏斜的谓词分布,改进了现有方法并在 Action Genome 和 VidOR 基准测试中表现优异。