BriefGPT.xyz
Ask
alpha
关键词
triplet loss scheme
搜索结果 - 2
ViSiL: 细粒度时空视频相似性学习
本文介绍了 ViSiL,一种视频相似性学习架构,它考虑了视频对之间的细粒度时空关系,包括了相似性评估之前的整个帧或整个视频的向量描述。通过卷积神经网络,我们从提炼的帧间相似性矩阵中计算视频间相似度,以同时考虑帧内和帧间的相似性。我们的方法避
→
PDF
5 years ago
CVPR
使用对抗网络学习跨模态嵌入,用于烹饪食谱和食物图像
研究了食品领域跨模态检索的开放性研究任务,提出了一种新的框架 Adversarial Cross-Modal Embedding(ACME)来解决这个问题,通过三元组损失和有效的采样策略学习公共嵌入特征空间,并实现模态对齐、跨模态翻译一致性
→
PDF
5 years ago
Prev
Next