CVPRAug, 2022

探索基于 Anchor 的自我 4D 自然语言查询检测

TL;DR本文提供 CVPR 2022 中 Ego4D 自然语言查询挑战的技术报告,针对当前自然语言查询任务使用第三人称视角数据集,未涉及目前使用第一人称视角数据集(例如 Ego4D)面临的较小时间跨度和更复杂的视频理解问题,论文提出解决这些问题的方案。