社交媒体时尚知识提取

SIGIRSep, 2023

Social Media Fashion Knowledge Extraction as Captioning

Yifei Yuan, Wenxuan Zhang, Yang Deng, Wai Lam

TL;DR社交媒体在时尚行业中起到了重要作用，本论文研究了社交媒体时尚知识抽取任务，将其作为一个描述问题来处理，旨在从社交媒体帖子中直接生成基于句子的时尚知识。

Abstract

social media plays a significant role in boosting the fashion industry, where a massive amount of fashion-related posts are generated every day. In order to obtain the rich fashion information from the posts, we

social media fashion industry fashion knowledge knowledge extraction captioning problem

发现论文，激发创造

从社交媒体中提取时尚知识：谁、在哪里、穿什么？

本篇论文提出了一种从社交媒体中自动提取时尚知识的方法，该方法结合了图像、文本和元数据多种模态中的场合、人物和服装三个方面进行探测，并采用上下文化时尚概念学习模块提供了对于人物检测和服装识别的解决方案，在机器标注数据有限的情况下，通过弱标签建模模块有效地利用了机器标注数据。实验结果证明了我们的模型在时尚概念预测方面的有效性以及提取知识与全面分析的有用性。

Aug, 2019

社交媒体中的时尚知识自动提取

本文提出了一种从社交媒体自动收集时尚知识的新系统，它通过图像、文本和元数据的多个模态统一了场合、人物和服装发现的三个任务，并应用上下文化的时尚概念学习模型来提高时尚概念学习性能，同时通过弱标签建模方法进一步提高性能，并构建了一个网站来展示我们的系统提取的时尚知识的质量。

Aug, 2019

社交媒体中与时尚相关帖子的情感分析

在社交媒体平台中，基于多模态的情感分析是时尚相关帖子分析中的两大主要挑战，我们提出了一种新的框架，该框架可以共同利用图像视觉，帖子文本和时尚属性模态来确定情感类别。

Nov, 2021

时尚字幕生成：基于语义奖励的准确描述生成

本文介绍了一种新颖的学习框架，结合属性级语义，句子级语义和强化学习来生成精确的时尚图片描述，同时构建了一个新的时尚图片描述数据集以证明模型的有效性。

Aug, 2020

借用人类感官：面向社交媒体多模态分类的评论感知自我训练

本研究提出了一种利用用户评论建模和自监督学习的方法，用于在社交媒体上进行图像文字关系分类、讽刺检测、情感分类和仇恨言论检测等多模态分类任务，结果表明该方法进一步提高了先前最先进模型的性能。

Mar, 2023

FaD-VLP: 面向统一检索和说明的时尚视觉语言预训练

提出了一个基于三元组生成的时尚特定预训练框架和可同时执行时尚检索和字幕任务的灵活解码器模型设计，具有跨模态检索、图像检索、图像字幕和多模态分类等多种功能。

Oct, 2022

神经时尚图片字幕生成：考虑数据多样性

本研究使用 InFashAIv1 和 DeepFashion 数据集，使用 Show and Tell 算法生成时尚图片的描述，取得更好的效果，并发现对于非洲风格的时尚图片，联合训练提高了图像描述质量，表明西方风格数据的迁移学习是可行的，释放了 InFashAIv1 数据集以促进更多包容性工作。

Jun, 2021

为品牌准备的社交媒体即时标题生成

通过建立一个包含图像字幕模型和品牌个性化社交媒体字幕生成模型的流水线解决方案，我们提出一种协助品牌创作符合图像和品牌个性的吸引人社交媒体字幕的方法，使用者可以灵活地提供希望包含在字幕中的主题标签、Instagram 账号、URL 和命名实体，从而使字幕内容与社交媒体标识更有语义相关性。我们的方法在定性和定量的评估中与各种基准方法进行比较，证明了其有效性。

Jan, 2024

如何从社交媒体中提取时尚趋势？具有无监督学习支持的强大对象检测器

本文利用一种通用的物品识别器，通过无监督学习对从社交媒体上收集的 24 个类别，共 60,000 张未标注的衣物照片进行预训练，并对新出的 Open Images V4 数据集上的 8,200 张带标签的照片进行优化，其结果在小物体识别上比当前最先进的物品检测器提高了 11％到 17％，并且在测试图片上达到了 72.7％的平均精度。

Jun, 2018

社交媒体新闻帖子中的多模态语义不一致检测

本研究提出了一种用于识别社交媒体新闻帖子中视频外观和文本标题之间语义不一致的分类架构，通过使用基于文本分析、自动音频转录、语义视频分析、对象检测、命名实体一致性和面部验证的多模态融合框架来发现社交媒体帖子中的视频和标题之间的不匹配。通过训练和测试基于 4,000 个 Facebook 新闻帖子的新视频数据集，我们的多模态方法在随机标题和外观不匹配的情况下实现了 60.5％的分类准确性，而单模分别准确率不到 50％。进一步的消融研究证实了跨模态融合对于正确识别语义不一致性的必要性。

May, 2021