Jun, 2021

神经时尚图片字幕生成:考虑数据多样性

TL;DR本研究使用 InFashAIv1 和 DeepFashion 数据集,使用 Show and Tell 算法生成时尚图片的描述,取得更好的效果,并发现对于非洲风格的时尚图片,联合训练提高了图像描述质量,表明西方风格数据的迁移学习是可行的,释放了 InFashAIv1 数据集以促进更多包容性工作。