UniUD-FBK-UB-UniBZ 提交至 EPIC-Kitchens-100 多示例检索挑战赛 2022
该研究报告介绍了作者参加 EPIC-Kitchens-100 多实例检索挑战的技术细节和实验结果,使用不同损失函数对 25%的训练数据进行了两个模型的集成,并获得了 56.81%的 nDCG 和 42.63%的 mAP 的平均分数。
Jun, 2023
我们在 CVPR 2024 的 EPIC-KITCHENS-100 多实例检索挑战中提出了一种新的损失函数 —— 对称多相似性损失,通过与技巧和集成学习相结合,模型在公共排行榜上获得了 63.76% 平均 mAP 和 74.25% 平均 nDCG 的表现,展示了方法的有效性。
Jun, 2024
本研究介绍了我们在 2022 年 EPIC-KITCHENS-100 多实例检索挑战中的方法,首先将句子解析为动词和名词对应的语义角色,然后通过自注意力在多个嵌入空间内的三元损失函数利用语义角色语境化视频特征和文本特征,优于强基线方法的标准化折扣累积增益(nDCG),对于语义相似性更有价值,我们的提交在 nDCG 中排名第三,在 mAP 中排名第四。
Jun, 2022
本篇研究介绍了我们参加 EPIC-Kitchens 2019 动作识别挑战赛的技术细节,我们开发了数个 CNN-LSTA 和 HF-TSN 变体,并提交了由这两种模型家族组成的集成预测。我们的提交在公共排行榜上以 FBK-HUPBA 团队名列第一,在 S1 设置上达到了 35.54% 的动作识别准确率,在 S2 设置上达到了 20.25%。
Jun, 2019
本文介绍了我们参加 EPIC-Kitchens 2020 挑战赛所使用的技术细节,我们使用 Gate-Shift 模块和 EgoACO 来产生预测分数,最终我们的提交记录在公共排行榜上取得了 40.0%的 top-1 动作识别精度,使用了仅 RGB 的 S1 设置和 25.71%的 S2 设置。
Jun, 2020
本研究介绍了在 EPIC-Kitchens 物体检测挑战赛中,通过填充和混合数据等方法,提高了所提出方法的鲁棒性。运用 GRE-FPN、Hard IoU-imbalance Sampler 等技术提取更具代表性的全局物体特征,通过类平衡采样解决类别不平衡问题。进一步采用了随机加权平均和多尺度测试策略。实验结果表明,所提出的方法在 EPIC-Kitchens 的见和未见数据集上均显著提高了平均精度。
Jun, 2020
探究了不同的查询表示方法结合不同的检索模型对检索性能的影响,同时提出了一种基于关键词提取方法的检索模型,并通过实验表明,该方法结合传统或基于决策论的相关性模型,可以显著提高查询效果。
Jul, 2022
本研究介绍了一种利用信息图像区域来实现有效领域对齐的方法,并在 2022 EPIC-Kitchens 无监督领域适应(UDA)挑战中取得了第四名的成绩。该方法使用轻量级 CNN 提取输入双流视频帧的全局信息,并通过 One Shot 内容选择方法选择有信息量的图像块来进行特征对齐。
Jul, 2022
本文提出了基于视频 - 语言预训练的解决方案,利用最近发布的 Ego4D 数据集,从预训练数据集、预训练目标和开发集的角度开创了自我中心的视频 - 语言预训练学习,从而获得了优秀的性能表现。
Jul, 2022
基于 CLIP 架构,使用 SubCenter ArcFace loss ,dynamic margins 和提高 transfer learning 策略,以 Google Universal Image Embedding 竞赛为基础,创建了多样化的数据集,最终在 Kaggle 的排名中获得第六名,私有排行榜得分为 0.685。
Oct, 2022