Mar, 2020

跨模态食品检索:使用语义一致性和注意机制学习食品图片和配方的联合嵌入

TL;DR本文提出了一种名为 Semantic-Consistent and Attention-based Networks (SCAN) 的方法,可解决在跨模式食品数据中存在的内在方差大和间方差小的问题以及获取区分性食谱表示的难点,其目的是学习图像和食谱的嵌入,使相应的图像 - 食谱嵌入彼此靠近,然后在大规模的 Recipe1M 数据集上评估了该方法的性能,并表明它在食品图像和烹饪食谱的交叉检索方面优于几种最先进的策略。