ICCVAug, 2023
找到关注的焦点:面向事件的视频关键问题的 Transformer
Knowing Where to Focus: Event-aware Transformer for Video Grounding
Jinhyun Jang, Jungin Park, Jin Kim, Hyeongjun Kwon, Kwanghoon Sohn
TL;DR本文提出了一种事件感知的动态时刻查询方法,通过事件推理和时刻推理来预测视频中的时刻时间戳,实验证明了该方法在视频定位方面的有效性和高效性。