神经时尚图片字幕生成：考虑数据多样性

Jun, 2021

神经时尚图片字幕生成：考虑数据多样性

Neural Fashion Image Captioning : Accounting for Data Diversity

Gilles Hacheme, Noureini Sayouti

TL;DR本研究使用 InFashAIv1 和 DeepFashion 数据集，使用 Show and Tell 算法生成时尚图片的描述，取得更好的效果，并发现对于非洲风格的时尚图片，联合训练提高了图像描述质量，表明西方风格数据的迁移学习是可行的，释放了 InFashAIv1 数据集以促进更多包容性工作。

Abstract

image captioning has increasingly large domains of application, and fashion is not an exception. Having automatic item descriptions is of great interest for →

image captioning fashion dataset diversity show and tell model transfer learning

发现论文，激发创造

时尚字幕生成：基于语义奖励的准确描述生成

本文介绍了一种新颖的学习框架，结合属性级语义，句子级语义和强化学习来生成精确的时尚图片描述，同时构建了一个新的时尚图片描述数据集以证明模型的有效性。

Aug, 2020

质量与数量：揭示百万高质量时尚设计文本到图像合成的图片

AI 与时尚设计的融合已成为一个前景光明的研究领域，本论文提出了首个 Fashion-Diffusion 数据集，该数据集包含超过一百万高质量的时尚图片和详细的文本描述，并提供了多个用于评估时尚设计模型性能的数据集，推动了 AI 驱动的时尚设计领域的标准化和未来研究的进展。

Nov, 2023

AI 增强的客户体验推荐系统：一种新颖的图像到文本方法

利用人工智能为时尚推荐系统提供细粒度的视觉解释，自动为顾客上传的图像生成有意义的描述，引导从全球时尚产品目录中检索出符合视觉特征的类似替代品，进而实现个性化的时尚推荐，并在超过 100,000 张已分类的时尚照片数据集上进行训练和评估，物体检测模型的 F1 分数为 0.97，展示了优化的准确时尚物体识别能力，这个视觉感知系统代表了个性化时尚推荐中的重要进展。

Nov, 2023

生成多样而且丰富的自然语言时尚评论

本文针对多模态视觉与语言任务，提出了一种将深度生成编码器 - 解码器模型结合视觉注意力和最大互信息技术生成自然语言时装反馈的方法，并在公共设备 Echo Look 上进行了应用。

Jun, 2019

时尚智取：一个面向自然语言反馈检索图像的新数据集

该论文介绍了 Fashion IQ 数据集，支持互动式时装图像检索的研究和进展，提供了人工生成的注释、现实世界的产品描述和派生的视觉属性标签等，通过基于 transformer 的用户模拟器和交互式图像检索器提高对话式图像检索的效果，鼓励进一步开发更自然和适用于现实世界的购物助手。

May, 2019

时尚照片中的网民风格评论：数据集和多样性衡量

本研究提出了 Netizen Style Commenting (NSC) 框架，通过构建一个大规模的服装数据集 NetiLook，利用神经网络结合主题模型的方法来生成能够反映社交群体文化的评论，从而在发现用户意图，提高社交互动方面取得了良好的效果。

Jan, 2018

Fashion-Gen: 时尚生成数据集与挑战

本文介绍了一个由职业造型师提供的 293,008 张高清时尚图像和物品说明组成的数据集。我们在高分辨率图像生成和给定文本条件下的图像生成方面提供基准结果，并概述了一个基于此数据集的挑战的细节。

Jun, 2018

Attr2Style：基于服装属性的转移学习方法推断时尚风格

提出了一种基于迁移学习和编码 - 解码框架的图像字幕模型，用于在同时拥有属性和样式级别标注的源数据集上训练模型，并在仅拥有属性级别标注的目标数据集上预测样式级别的字幕。实验结果表明该方法生成的字幕与衣服的实际样式信息相近。

Aug, 2020

2015 MSCOCO 图像标注挑战赛的经验教训

本篇论文介绍一种基于深度递归结构的生成模型，其结合了近期在计算机视觉和机器翻译方面的进展，能够用于生成描述图像的自然语言句子，并经过多种数据集的实验，验证了模型的准确性和语言的流畅性。更重要的是，该模型是通过对图像描述的学习而得，在最近的 COCO 数据集比赛中获得了与 Microsoft Research 团队平分秋色的好成绩，并提供了一个基于 TensorFlow 开源的实现。

Sep, 2016

FIRST: 文本驱动的时尚综合与设计的百万条目数据集

通过介绍一个新的包含一百万高分辨率时尚图像和丰富结构化文本描述的数据集，本研究旨在推进基于文本的时尚合成和设计领域的研究，为使用先进的生成模型进行时尚合成和设计提供必要性。

Nov, 2023