MMMay, 2022

使用 Transformer 进行跨模态食谱嵌入及大批量训练

TL;DR本文提出了基于 Transformer 神经网络的大批量训练 (TNLBT) 的跨模型食谱检索框架,并应用层次 Transformer 的食谱文本编码器、Vision Transformer 的食谱图像编码器和对抗网络架构来实现更好的食谱文本和图像的交叉嵌入学习。同时利用自监督学习来挖掘不具备相应图像的食谱文本中的丰富信息,结果验证了使用大批量训练对跨模型食谱嵌入的有效性。在实验中,该框架显著优于当前的最先进跨模型食谱检索框架。