通过全局和本地图像 - 语言关联改进个体重新识别的深度视觉表示

ECCVAug, 2018

通过全局和本地图像 - 语言关联改进个体重新识别的深度视觉表示

Improving Deep Visual Representation for Person Re-identification by Global and Local Image-language Association

Dapeng Chen, Hongsheng Li, Xihui Liu, Yantao Shen, Zejian Yuan...

TL;DR本研究提出了一种利用自然语言描述作为附加训练监督的方法来有效地学习视觉特征。通过建立全局和局部图像 - 语言关联来实现语义一致性，该方法不仅能够学习更好的全局视觉特征，还能够强制对局部视觉和语言特征进行语义一致性的限制，从而实现了对于特定个体较为紧凑和语义的描述。在实验中，我们证明了语言作为训练监督在两种关联方案下具有有效性，并且在不使用任何辅助信息的情况下实现了最新的技术性能，比其他图像 - 语言交互的联合嵌入方法表现更出色。

Abstract

person re-identification is an important task that requires learning discriminative visual features for distinguishing different person identities. Diverse auxiliary information has been utilized to improve the v

person re-identification visual features natural language description image-language association semantic consistencies

发现论文，激发创造

视觉和语言的人物再识别

我们提出了一种新的人员再识别方法，使用图像和自然语言描述的联合视觉和语言模型，相比属性和 LSTM，使用自然语言描述和 CNN 可以显著提高标准 Re-ID 基准测试的性能。

Oct, 2017

探索基于部分信息的视觉 - 语言学习在人物再识别中的应用

最近，视觉语言学习在增强基于视觉的人物再识别方面展示了巨大的潜力。本文提出了一种名为 Part-Informed Visual-language Learning (π-VL) 的方法，通过在 ReID 任务中利用部分信息语言监督来增强细粒度的视觉特征，该方法在四个常用的 ReID 基准测试中取得了显著的改进，特别是在最具挑战性的 MSMT17 数据库中达到了 90.3% 的 Rank-1 和 76.5% 的 mAP，而无需任何额外的技术手段。

Aug, 2023

深度联合学习多损失分类的个体重识别

本文提出了一种使用 CNN 联合学习局部和全局特征的方法，用于重新识别目标，实现了对多任务的优化，通过优化多任务的联合损失函数，达到一种损失函数的平衡，该模型在 VIPeR、GRID、CUHK01、CUHK03 和 Market-1501 的五个基准测试中优于现有的各种重新识别方法。

May, 2017

PLIP: 人物表示学习的语言图像预训练

该研究提出了一种新的预训练框架用于人物表征学习，名为 PLIP，其中包括三个预文本任务：图像着色、属性预测和视觉 - 语言匹配，在一个新的大规模人物数据集 SYNTH-PEDES 上对其进行了评估并取得了优于先前方法的效果。

May, 2023

基于综合图像 - 语言线索的短语定位和视觉关系检测

该论文提出了一种利用大量语言和视觉线索定位或落实图像中短语的框架，该系统在 Flickr30k 实体数据集的短语定位和斯坦福 VRD 数据集的视觉关系检测上取得了最先进的性能。

Nov, 2016

人物再识别遇到图像搜索

本文将人员再识别作为图像搜索问题，并通过设计一种无监督的词袋表示法，将图像搜索技术整合到人员再识别中。同时，贡献了一个新的高质量数据集，在三个数据集上得到了与最先进方法相当的竞争结果。

Feb, 2015

基于邻居引导标签优化的协同学习无监督可见 - 红外人员再识别

本文介绍了一种多模态学习方法，称为 Dual Optimal Transport Label Assignment（DOTLA）框架，用于学习无标签跨模态数据集中的多模态特征。同时，本文还介绍了一种基于跨模态邻域一致性的标签完善和正规化模块，以提高模型的准确性。实验结果表明该方法优于现有的各种无监督和监督方法。

May, 2023

通过多粒度图像文本对齐提高基于描述的人员再识别

本文提出了一个 Multi-granularity Image-text Alignments (MIA) 模型，用于减轻描述基础人物的 Re-id 中的跨模态细粒度问题，以进行更好的相似度评估。实验表明，该方法在 CUHK-PEDES 数据集上取得了最先进的性能，并且实现了显着优于以往方法的效果。

Jun, 2019

视频人员再识别的自适应图表示学习

提出一种创新性的自适应图形表示学习方案，用于视频人员重识别；该方案利用姿势对齐连接和特征亲和连接构建自适应结构感知邻接图，以迭代地完善区域特征，并将周围节点信息考虑在部分特征表示中；进一步提出了一种新的时间分辨率感知正则化，用于学习紧凑而区分性的特征表示。

Sep, 2019

全球引导下的视频人物再识别的互相学习

该论文提出了一种新颖的全球引导的互逆学习（GRL）框架，其中包括全局引导相关估计（GCE）和时态互逆学习（TRL）机制，用于视频人员重新识别，可以更好地利用视频中的空间和时间线索，并在三个公共基准上实现了比其他现有技术更好的表现。

Mar, 2021