神经时尚图片字幕生成:考虑数据多样性
本文介绍了一种新颖的学习框架,结合属性级语义,句子级语义和强化学习来生成精确的时尚图片描述,同时构建了一个新的时尚图片描述数据集以证明模型的有效性。
Aug, 2020
AI 与时尚设计的融合已成为一个前景光明的研究领域,本论文提出了首个 Fashion-Diffusion 数据集,该数据集包含超过一百万高质量的时尚图片和详细的文本描述,并提供了多个用于评估时尚设计模型性能的数据集,推动了 AI 驱动的时尚设计领域的标准化和未来研究的进展。
Nov, 2023
利用人工智能为时尚推荐系统提供细粒度的视觉解释,自动为顾客上传的图像生成有意义的描述,引导从全球时尚产品目录中检索出符合视觉特征的类似替代品,进而实现个性化的时尚推荐,并在超过 100,000 张已分类的时尚照片数据集上进行训练和评估,物体检测模型的 F1 分数为 0.97,展示了优化的准确时尚物体识别能力,这个视觉感知系统代表了个性化时尚推荐中的重要进展。
Nov, 2023
本文针对多模态视觉与语言任务,提出了一种将深度生成编码器 - 解码器模型结合视觉注意力和最大互信息技术生成自然语言时装反馈的方法,并在公共设备 Echo Look 上进行了应用。
Jun, 2019
该论文介绍了 Fashion IQ 数据集,支持互动式时装图像检索的研究和进展,提供了人工生成的注释、现实世界的产品描述和派生的视觉属性标签等,通过基于 transformer 的用户模拟器和交互式图像检索器提高对话式图像检索的效果,鼓励进一步开发更自然和适用于现实世界的购物助手。
May, 2019
本研究提出了 Netizen Style Commenting (NSC) 框架,通过构建一个大规模的服装数据集 NetiLook,利用神经网络结合主题模型的方法来生成能够反映社交群体文化的评论,从而在发现用户意图,提高社交互动方面取得了良好的效果。
Jan, 2018
本文介绍了一个由职业造型师提供的 293,008 张高清时尚图像和物品说明组成的数据集。我们在高分辨率图像生成和给定文本条件下的图像生成方面提供基准结果,并概述了一个基于此数据集的挑战的细节。
Jun, 2018
提出了一种基于迁移学习和编码 - 解码框架的图像字幕模型,用于在同时拥有属性和样式级别标注的源数据集上训练模型,并在仅拥有属性级别标注的目标数据集上预测样式级别的字幕。实验结果表明该方法生成的字幕与衣服的实际样式信息相近。
Aug, 2020
本篇论文介绍一种基于深度递归结构的生成模型,其结合了近期在计算机视觉和机器翻译方面的进展,能够用于生成描述图像的自然语言句子,并经过多种数据集的实验,验证了模型的准确性和语言的流畅性。更重要的是,该模型是通过对图像描述的学习而得,在最近的 COCO 数据集比赛中获得了与 Microsoft Research 团队平分秋色的好成绩,并提供了一个基于 TensorFlow 开源的实现。
Sep, 2016
通过介绍一个新的包含一百万高分辨率时尚图像和丰富结构化文本描述的数据集,本研究旨在推进基于文本的时尚合成和设计领域的研究,为使用先进的生成模型进行时尚合成和设计提供必要性。
Nov, 2023