CVPRJun, 2024

ObjectNLQ @ Ego4D Episodic Memory Challenge 2024

TL;DR本文介绍了我们在 CVPR 2024 的 Ego4D Episodic Memory Benchmark 中,对于自然语言查询和目标步骤的研究领域的方法。我们的方法不仅处理了视频的时间信息,还在帧内空间上识别了细粒度对象,通过引入 ObjectNLQ 来增强视频表示,提高了定位的准确性。