BriefGPT.xyz
大模型
Ask
alpha
关键词
fashion domain
搜索结果 - 4
CVPR
SyncMask:时尚中心化视觉 - 语言预训练的同步注意屏蔽
通过生成准确定位信息在图像和文本中同时出现的图像块和单词标记的掩码,SyncMask 解决了时尚数据集中图像和文本之间信息不匹配的问题,并在时尚数据集中的三个下游任务中表现出优秀的性能。
PDF
3 months ago
EMNLP
FaD-VLP: 面向统一检索和说明的时尚视觉语言预训练
提出了一个基于三元组生成的时尚特定预训练框架和可同时执行时尚检索和字幕任务的灵活解码器模型设计,具有跨模态检索、图像检索、图像字幕和多模态分类等多种功能。
PDF
2 years ago
ICCV
CurlingNet:面向时尚 IQ 数据的图片文本组合学习
CurlingNet 是一种可以测量图像 - 文本嵌入的语义距离的方法,利用交付和扫描两个关键组件来学习对时尚领域的数据进行有效的图像 - 文本组合,并采用通道间的门控机制,其单个模型在 ICCV2019 的第一次 fashion-IQ 挑
→
PDF
4 years ago
ICCV
面向多标签时尚图像分类的姿势引导注意力
本篇文章基于自动姿态提取,提出了在时尚领域中用于多标签分类的带引导注意力的紧凑框架,通过视觉语义注意力模型(VSAM)进行监督,在不使用地标注注释的情况下在 DeepFashion 数据集上取得了与之前工作相当的性能,同时还证明了我们的语义
→
PDF
5 years ago
Prev
Next