IIITD-20K: 文本 - 图像 ReID 的密集字幕

May, 2023

IIITD-20K: 文本 - 图像 ReID 的密集字幕

IIITD-20K: Dense captioning for Text-Image ReID

A V Subramanyam, Niranjan Sundararajan, Vibhu Dubey, Brejesh Lall

TL;DR提出了一个新的名为 IIITD-20K 的数据集，包括 20000 个在野外抓取的唯一身份的密集标题，使用生成图像和精细的标题进一步多样化身份，并进行了实验以将其与目前最先进的文本到图像 ReID 模型进行对比。

Abstract

Text-to-Image (T2I) ReID has attracted a lot of attention in the recent past. CUHK-PEDES, RSTPReid and ICFG-PEDES are the three available benchmarks to evaluate T2I ReID methods. RSTPReid and ICFG-PEDES comprise of identities from MSMT17 but due to limited number of unique persons, the

text-to-image reid benchmarks dataset dense captions synthetic generation

发现论文，激发创造

文本到图像的人物重识别的噪声一致化学习

提出了一种用于文本到图像的人物再识别的鲁棒双重嵌入方法 (RDE)，能够学习到在存在噪音对应的情况下的可靠的视觉语义关联。

Aug, 2023

基于伪造文本的统一预训练技术用于文本 - 图像人物重识别

该论文介绍了一种面向文本到图像人物重识别任务的统一预训练方法 (UniPT)，通过构建大规模的文本标注人物数据集、使用视觉 - 语言预训练框架来对齐图像和文本模态的特征空间，解决了数据不一致性和训练不一致性的问题。UniPT 在多个数据集上取得了有竞争力的准确率。

Sep, 2023

基于更丰富自我学习的文本至图像人物重识别中的综合表示学习

基于多对多匹配和多视角信息的文本到图像的个体重识别，并使用 LCR^2S 框架提出了一个轻量级模型用于推理时进行语义关联和多视角信息推理，以实现准确的文本到图像检索。

Oct, 2023

SeFi-IDE：面向个性化扩散生成的语义保真身份嵌入

本文通过面部区域适应和语义保真令牌优化的两个角度，将准确和语义保真的 ID 嵌入到稳定扩散模型中，以实现个性化生成，并通过实验证明与以前的方法相比，我们的结果在 ID 准确性和操作能力方面表现出更卓越的能力。

Jan, 2024

目标图像数据增强提高基本技能字幕鲁棒性

通过填补世界相关性结构的缺失，利用文本到图像生成模型改进人类模型在性别识别等方面的能力，显示了一种目标图像编辑数据增强方法在性别、颜色和计数能力方面提高图像字幕度量的性能，并分析了图像字幕模型在视觉编码和文本解码方面的不同行为表现。

Sep, 2023

文本与图像人物再识别的提示解耦

这篇论文主要研究了使用文本描述查询来进行图像中的人物重识别，并提出了一种两阶段训练方法，通过解耦域适应和任务适应的过程来改善性能。

Jan, 2024

ID-Aligner: 用奖励反馈学习增强保持身份的图文生成

通过引入通用反馈学习框架，本研究提出了 ID-Aligner 方法用于改进 ID-T2I 性能，解决参考肖像的身份特征保留、生成图像的美学吸引力缺失以及与 LoRA 和 Adapter 方法的兼容性等关键问题。大量的实验证明了这一方法的有效性。

Apr, 2024

YYDS：粗略描述的可见光红外人员再识别

通过引入 YYDS 结构来解决可见光 - 红外人员重新识别的问题，同时使用粗糙语言描述信息进行目标可见图像匹配，以补充缺失的颜色信息，并使用 CMKR 算法进行近邻模态偏差问题的改善。

Mar, 2024

基于 CLIP 的细粒度文本图像人员再识别

提出了一种基于 CLIP 驱动的细粒度信息挖掘框架 (CFine)，旨在为 TIReID 提供强大的多模态知识，通过细粒度信息挖掘，建立跨模态对齐，并在多个基准测试上显示了其优越的性能。

Oct, 2022

Lafite2: 少样本文本到图像生成

本文提出了一种在仅有图像数据集的情况下预训练文本到图像生成模型的新方法，通过检索和优化过程综合生成伪文本特征，可以灵活应用于各种情境和模型，并在实验中表现出显著的效果，GAN 模型在完全监督的情况下得到了 6.78 的 FID，是 GAN 最新的 SoTA 结果。

Oct, 2022