Jun, 2023

Ego4D 情景记忆挑战 2023 的行动敏感度学习

TL;DR本报告介绍了 ReLER 在 Ego4D 情节记忆基准测试中提交的两个轨道,包括自然语言查询和时刻查询。我们的解决方案继承了我们提出的行动敏感性学习框架(ASL),以更好地捕捉帧的差异信息。此外,我们整合了一系列更强大的视频特征和融合策略。我们的方法在时刻查询挑战赛中获得了 29.34 的平均 mAP,排名第 1,在自然语言查询挑战中获得了 19.79 的平均 R1,排名第 2。我们的代码将发布。