文本到图像的人物重识别的噪声一致化学习

Aug, 2023

文本到图像的人物重识别的噪声一致化学习

Noisy-Correspondence Learning for Text-to-Image Person Re-identification

Yang Qin, Yingke Chen, Dezhong Peng, Xi Peng, Joey Tianyi Zhou...

TL;DR提出了一种用于文本到图像的人物再识别的鲁棒双重嵌入方法 (RDE)，能够学习到在存在噪音对应的情况下的可靠的视觉语义关联。

Abstract

text-to-image person re-identification (TIReID) is a compelling topic in the cross-modal community, which aims to retrieve the target person based on a textual query. Although numerous TIReID methods have been proposed and achieved promising performance, they implicitly assume the trai

text-to-image person re-identification robust dual embedding noisy correspondence confident consensus division triplet-alignment loss

发现论文，激发创造

基于更丰富自我学习的文本至图像人物重识别中的综合表示学习

基于多对多匹配和多视角信息的文本到图像的个体重识别，并使用 LCR^2S 框架提出了一个轻量级模型用于推理时进行语义关联和多视角信息推理，以实现准确的文本到图像检索。

Oct, 2023

基于 CLIP 的细粒度文本图像人员再识别

提出了一种基于 CLIP 驱动的细粒度信息挖掘框架 (CFine)，旨在为 TIReID 提供强大的多模态知识，通过细粒度信息挖掘，建立跨模态对齐，并在多个基准测试上显示了其优越的性能。

Oct, 2022

IIITD-20K: 文本 - 图像 ReID 的密集字幕

提出了一个新的名为 IIITD-20K 的数据集，包括 20000 个在野外抓取的唯一身份的密集标题，使用生成图像和精细的标题进一步多样化身份，并进行了实验以将其与目前最先进的文本到图像 ReID 模型进行对比。

May, 2023

文本到图像的跨模态自适应双重关联

本文提出了 CADA：交叉模态自适应双向关联机制，通过文本到图像和图像到文本的双向关联来实现文本到图像的人物再识别，实验证明了该双向关联机制的优越性。

Dec, 2023

面向人员再识别的语义对齐表示学习

本论文提出了一种通过细致的监督设计，驱动重新识别网络学习语义对齐特征表示的框架，其中包括了一个带编码器（SA-Enc）的 Semantics Aligning Network (SAN) 用于重新识别，以及一个解码器（SA-Dec）用于重建 / 回归密集语义对齐全纹理图像，并在三元组 ReID 约束下增加感知损失，以确保推断的计算效率。该设计取得了基准数据集 CUHK03，Market1501，MSMT17 和部分人物重新 ID 数据集 Partial REID 等的最佳表现。

May, 2019

文本与图像人物再识别的提示解耦

这篇论文主要研究了使用文本描述查询来进行图像中的人物重识别，并提出了一种两阶段训练方法，通过解耦域适应和任务适应的过程来改善性能。

Jan, 2024

文本 - 图像语义自对齐网络用于部位感知的人员再识别

本文提出了一种语义自对齐网络 (SSAN)，旨在解决文本到图像中的人物再识别 (text-to-image person re-identification) 中的问题。SSAN 使用一个新颖的手段 —— 自动从两种模态提取语义对齐的部分级特征，并通过设计一个多视角非局部网络来捕捉身体部分之间的关系，从而建立更好的身体部位和名词短语之间的对应关系。此外， SSAN 还引入了一种 Compound Ranking (CR) loss，利用同一身份的其他图像的文本描述提供额外的监督，从而有效地降低文本特征的类内差异。经过广泛的实验，证明了该方法在性能上优于现有的最先进方法和一些高级算法，并提供了新的 ICFG-PEDES 数据集和 SSAN 代码。

Jul, 2021

YYDS：粗略描述的可见光红外人员再识别

通过引入 YYDS 结构来解决可见光 - 红外人员重新识别的问题，同时使用粗糙语言描述信息进行目标可见图像匹配，以补充缺失的颜色信息，并使用 CMKR 算法进行近邻模态偏差问题的改善。

Mar, 2024

CPCL：跨模态原型对比学习弱监督的基于文本的人员再识别

提出了一种基于弱监督的文本驱动的人物重识别方法，使用跨模态原型对比学习和多模态记忆模块来改善检索性能。

Jan, 2024

减少文本编码器在零样本组合图像检索中的任务差异

Composed Image Retrieval (CIR) using zero-shot setting and CLIP encoders can be improved by reducing task discrepancy through novel target-anchored contrastive learning for text encoders.

Jun, 2024