Aug, 2023
FashionLOGO:多模态大型语言模型用于时尚 LOGO 嵌入
FashionLOGO: Prompting Multimodal Large Language Models for Fashion Logo Embeddings
Yulin Su, Min Yang, Minghui Qiu, Jing Wang, Tao Wang
TL;DR通过引入多模式大型语言模型 (MLLMs),我们提出了一种名为 FashionLOGO 的新方法,利用文本知识作为辅助来提高时尚 Logo 嵌入的鲁棒性,在三个真实数据集上广泛实验,证明 FashionLOGO 学习到了广义且鲁棒的 Logo 嵌入,取得了最先进的性能。