SIGIRApr, 2018

烹饪情境下的跨模态检索:学习语义文本 - 图像嵌入

TL;DR本文提出了一种跨模态检索模型,采用视觉和文本数据对餐品及其食谱进行建模,并在包含近 100 万图像配方对的 Recipe1M 数据集上进行了验证,取得了比先前最先进模型更好的效果,并针对计算烹饪应用案例展示了质量结果。