Aug, 2021

社交织物:用于视频关系检测的Tubelet组合

TL;DR本文提出了一种通过分类和检测视频中的对象tubelets之间的关系来实现主语-谓语-宾语三元组的方法,通过学习所有关系中的交互原语来紧凑地表示对象tubelets对的编码,并展示了其在两个基准测试上的最新成果,同时展示了如何使用编码实现按原语示例查询时空关系。