SIGIRApr, 2018
烹饪情境下的跨模态检索:学习语义文本 - 图像嵌入
Cross-Modal Retrieval in the Cooking Context: Learning Semantic Text-Image Embeddings
Micael Carvalho, Rémi Cadène, David Picard, Laure Soulier, Nicolas Thome...
TL;DR本文提出了一种跨模态检索模型,采用视觉和文本数据对餐品及其食谱进行建模,并在包含近 100 万图像配方对的 Recipe1M 数据集上进行了验证,取得了比先前最先进模型更好的效果,并针对计算烹饪应用案例展示了质量结果。