UniCat：为多模态重新识别构建更强的融合基线

Oct, 2023

UniCat：为多模态重新识别构建更强的融合基线

UniCat: Crafting a Stronger Fusion Baseline for Multimodal Re-Identification

Jennifer Crawford, Haoli Yin, Luke McDermott, Daniel Cummings

TL;DR多模态重新识别是一个流行的检索任务，旨在跨不同数据流重新识别对象，本研究发现现有的后期融合技术在与训练单独的模态比较时产生次优潜在表示，我们探讨了这种效应主要是由于融合使用时对个别模态的训练目标不经意地放松，他人称之为模态懒散。我们提出了一个细致的观点，即这种放松可能导致某些模态无法充分利用可用的任务相关信息，然而，对于噪声模态提供了保护屏障，防止它们过拟合到无关数据，我们的发现还表明，当与已知最佳训练技术配对时，单模态拼接（UniCat）和其他后期融合的单模态骨干集成在多个多模态 ReID 基准测试中超过了当前的最先进性能，通过揭示 “模态懒散” 的双刃剑，我们推动未来研究在平衡局部模态优势和全局表示方面。

Abstract

multimodal re-identification (ReID) is a popular retrieval task that aims to re-identify objects across diverse data streams, prompting many researchers to integrate multiple modalities into a unified representation. While such fusion promises a holistic view, our investigations shed l

multimodal re-identification late-fusion techniques modality laziness unimodal concatenation modality strength

发现论文，激发创造

可见光与红外人员再识别的模态统一网络

通过引入一个新的模态统一网络（MUN），本研究针对可见光 - 红外人员重识别（VI-ReID）中的大量跨模态差异和类内变异问题，通过动态建模模态特定和模态共享表示来提取判别特征表达，从而使所提出的方法在多个公共数据集上明显超过当前最先进的方法。

Sep, 2023

野外多模式再识别的全能框架

引入了一个新颖的多模态学习范式（称为 All-in-One），利用一个预训练的大模型作为编码器，实现了高效的多模态检索，克服了不同模态数据的挑战，同时在零样本和领域泛化情境中展示出卓越的性能。

May, 2024

学习用于异质人物再识别的跨模态信息瓶颈表示

通过互信息和模态一致性网络，提取具有代表性信息的模态不变身份特征，减少冗余，消除模态差异，并对关键部分进行全局 - 局部特征提取，以实现可见 - 红外人物重识别任务。

Aug, 2023

利用单模型教师提升多模态学习

通过结合融合目标和单模态蒸馏的方法，提出了一种新的多模态学习方法 Uni-Modal Teacher 解决模态失败问题，为实现真实世界的机器人应用奠定了基础。

Jun, 2021

基于损坏的多模态数据的实时监控下的视觉 - 红外人员再识别融合

本文提出一种名为具有多种模态中间流融合（MMSF）的高效模型，用于多模态可见光红外人物再识别，旨在提高对损坏的多模态图像的鲁棒性。同时，我们还提出新的可扩展的受损数据集和策略，以提高 V-I 个人再识别系统在现实世界操作条件下的准确性与鲁棒性。

Apr, 2023

一种用于电子商务产品分类的多模态后融合模型

本研究基于文本和图像模态探讨了一种基于多模态晚期融合的方法，以对 Rakuten 上的电子商务产品进行分类，并证明了该方法相比于单模态和其他多模态方法的有效性和优越性。该研究团队在 SIGIR 2020 电子商务研讨会数据挑战赛的多模态产品分类任务中以 0.9144 的 macro-F1 得分荣获第一名。

Aug, 2020

MLLMReID: 基于多模态大型语言模型的人员再识别

这篇论文提出了一种名为 MLLMReID 的多模态大型语言模型，通过细调和指导学习的方式来优化人员再识别任务，并通过实验证明了其优越性。

Jan, 2024

目标重新识别的 Transformer：一项综述

该论文综合评述了基于 Transformer 的物体再识别 (Re-ID) 的现有工作，涵盖了多个领域和挑战，并提出了一个基于 Transformer 的新方法 UntransReID，同时还讨论了未来研究中的重要问题。

Jan, 2024

通过替代训练增强基于会话的推荐中的 ID 和文本融合

为了解决会话推荐中 ID 模式与文本模式平衡的问题，本研究基于 AlterRec 提出了一种新的训练策略，通过分离 ID 和文本的训练，避免了平衡问题，并设计了一种促进两种模式互相学习和更有效地整合文本的策略。实验证明 AlterRec 在会话推荐中的有效性。

Feb, 2024

学习渐进式多模态共享的转换器以实现有效的可见 - 红外人员重识别

本文提出了一种名为 PMT 的深度学习框架，它采用渐进式共享模态转换器来解决 VI-ReID 任务中复杂的模态变化问题，并对模态共享特征进行可靠度和共性分析；同时提出了一种 Discriminative Center Loss (DCL)，结合 Modality-Shared Enhancement Loss (MSEL) 来缓解大内部差异和小类间差异问题，从而更好地区分共享特征，该框架在 SYSU-MM01 和 RegDB 数据集上的表现优于现有的大多数最新状态 - of-the-art 方法。

Dec, 2022