Jul, 2022

ReLER@ZJU-Alibaba 参加 Ego4D 自然语言查询竞赛 2022

TL;DR使用多尺度跨模态 Transformer 和视频帧级对比损失来解决 Ego4D 自然语言查询挑战问题,该方法在排行榜上排名第一。