BriefGPT.xyz
Ask
alpha
关键词
cross-modal recipe retrieval
搜索结果 - 3
MM
使用 Transformer 进行跨模态食谱嵌入及大批量训练
本文提出了基于 Transformer 神经网络的大批量训练 (TNLBT) 的跨模型食谱检索框架,并应用层次 Transformer 的食谱文本编码器、Vision Transformer 的食谱图像编码器和对抗网络架构来实现更好的食谱文
→
PDF
2 years ago
CVPR
层次变换器与自监督学习优化跨模态菜谱检索
本研究针对跨模态食谱检索任务,提出一个基于端到端模型的层级食谱 Transformer,使用自我监督损失函数在图像和食谱样本上训练,取得了 Recipe1M 数据集上的最佳性能表现。
PDF
3 years ago
跨模式食谱检索的分治策略:从最近邻基线到最佳表现
我们提出了一种新颖的非参数方法,用于跨模式菜谱检索,结合图像和文本嵌入,通过将我们的方法与用自监督分类目标独立训练的标准方法相结合,我们创建了一个基准模型,在挑战性的图像到菜谱任务上优于大多数现有方法。我们还使用我们的方法比较使用不同现代方
→
PDF
5 years ago
Prev
Next