- DesignProbe: 多模式大语言模型的平面设计基准
多模式大型语言模型 (MLLMs) 在设计方面的能力是 DesignProbe 基准测试旨在研究的重点。通过对两个级别的设计元素和整体设计进行八个任务的测试,我们发现改进提示可以提高 MLLMs 的性能,并且添加图像比添加文本更能提升性能。
- 增强电子商务属性提取:创新的装饰关系修正和基于 LLAMA 2.0 的标注
本研究提出了一种创新的框架,将 BERT 用于分类、有条件随机场(CRFs)层用于属性值提取,以及大型语言模型(LLMs)用于数据标注,显著提高了对顾客查询中属性的识别能力。通过在电子商务数据中细致的产品类型和属性间的关系上引入装饰关系修正 - 走向统一的基于文本的人员检索:一个大规模多属性和语言搜索基准
本文提出了名为 MALS 的大型文本人物检索数据集,探讨了在属性识别和图像文本匹配任务上进行预训练的可行性,并使用 APTM 框架进行验证,取得了 3 个现实世界基准测试的最新检索表现。
- 基于 DETR 的分层服装分割和细粒度属性识别
本文提出了一种新型 DETR 方法,在 Fashionpedia 数据集上训练,通过采用多层注意力模块来聚合不同规模的特征,识别出整体服装实例的细粒度属性并实现服装的分割,超越了领域内之前最先进的模型。
- MMFL-Net: 跨界时尚检索的多尺度和多粒度特征学习
提出了一种新颖的多尺度、多粒度特征学习网络(MMFL-Net),旨在训练一个 C2S 时装视觉相似性的跨领域模型,其中包括对抗域差异的设计和多任务属性识别和分类模块的组合。
- FewSOL: 机器人环境中的小样本目标学习数据集
介绍了 Few-Shot Object Learning (FewSOL) 数据集,用于针对每个物体进行少量图像识别,研究结果表明目前机器人环境下还有一定提升空间,适用于研究分类、检测、分割、形状重构、姿态估计、关键点对应和属性识别等少量图 - ECCVFashionformer: 一种简单、有效和统一的基础模型,用于人类时尚分割和识别
本研究提出了一种基于 Vision Transformer 的人类时尚理解方法,通过联合分割和属性识别任务实现,使用对象和属性查询链接分割和预测结果,并使用 Multi-Layer Rendering 模块实现更细粒度的特征探索,实验证明该 - CVPRSeCGAN:基于语义一致性的平行条件生成式对抗网络用于人脸编辑
通过提出一种语义信息导向的生成对抗网络 SeCGAN,可无需指定目标语义掩码的情况下,利用语义信息进行人脸图像编辑,从而在保持质量指标的前提下,在 CelebA 和 CelebA-HQ 上生成具有更准确属性的面部图像,优于竞争基线项。
- 自动驾驶车辆 32 个行人属性的检测
本文介绍了一种基于多任务学习的模型,通过一个复合场景的框架实现了车载摄像头下的行人检测和 32 种行人属性的识别,其中包括道路等待行为的预测,结果在自动驾驶领域表现出竞争力和稳定性。
- CVPR属性识别的分层特征嵌入
提出了一种基于层次化特征嵌入框架的属性识别方法,结合属性和 ID 信息学习细粒度特征嵌入,在同一属性和同一 ID 下收集更紧密的样本,通过 HFE 损失和附加正则化组件以及动态损失权重实现。在两个行人属性数据集和一个面部属性数据集上,实验表 - ECCV为什么匹配?解释图像相似性模型的行为
本文提出了一种用于解释图像相似性模型的网络解释的显著属性(SANE)方法,该方法通过显着性图标明重要的图像区域并用最佳描述匹配的属性解释,该方法在多个数据集上均能表现通用性和提高了传统的属性识别任务的性能。
- CVPR利用多通道注意力子网络解释特征空间
本文提出了一种基于多通道注意力机制的卷积神经网络结构,可以为每个特征生成不同的注意力掩蔽,并应用于多属性识别任务中,其实验结果表明该方法不仅高度透明可解释,而且准确把握数据的属性。
- 基于序列的人物属性识别与联合 CTC-Attention 模型
本文提出了一种联合 CTC-Attention 模型(JCM),该模型将属性标签映射到序列中以学习属性之间的语义关系,并采用神经网络将图像编码为序列,采用了注意力模型解码序列,从而更好地学习语义信息,实验结果表明该方法对属性识别具有有效性。
- 深度时尚图像的细粒度属性识别注释改进
该研究旨在通过选择具有足够图像数量的类别,删除非常稀少的属性以及在每个类别中合并重复属性,为细粒度属性识别任务量身定制 DeepFashion 数据集,并使用成对排名损失函数的双线性卷积神经网络进行多标签细粒度属性识别,提高了结果,并提供了 - ICCV通过上下文和相关性的联合循环学习进行属性识别
本文使用 Joint Recurrent Learning 模型来探索属性上下文和相关性,以提高在训练数据较少,图像质量差的情况下的属性识别,并展示了该模型在 PETA 和 RAP 两个最大的行人属性基准上的优越性能和鲁棒性。
- 通过属性和身份学习提高人物再识别能力
提出了一种基于属性标签和 ID 标签互补的 Attribute-Person Recognition(APR)网络,该网络是一个多任务网络,可以学习重新识别嵌入并同时预测行人属性,通过在两个大规模数据集上进行人物重新识别与属性识别的实验,实 - CVPRDeepCAMP:深度卷积行为与属性中层模式
本文介绍了一种新型的卷积神经网络 ——DeepPattern,用于对人类行为和属性进行细分,通过训练得到了一组具有辨别力的中层特征图像块,为行为分类和属性识别提供了一种新的解决方法。