BriefGPT.xyz
Ask
alpha
关键词
cross-modal feature alignment
搜索结果 - 3
COLING
多模态语义理解与对比跨模态特征对齐
本篇研究提出了一种基于 CLIP 引导的对比学习的架构,用于执行多模态特征对齐,将来自不同模态的特征投影到一个统一的深度空间,实验结果表明,我们提出的模型在多模态讽刺检测和多模态情感分析任务中明显优于多个基准模型,我们的特征对齐策略相对于其
→
PDF
4 months ago
基于对比学习的多层交叉模态特征对齐,用于遥感图像场景的零样本分类
本文提出了一种通过对比学习进行多层次交叉模态特征对齐的方法,以用于遥感图像场景的零样本分类,实验结果表明该方法优于目前现有的零样本遥感图像场景分类方法。
PDF
a year ago
Clover: 一种统一的视频语言对齐和融合模型
本文提出了 Clover 方法,通过一种新颖的三模式对齐预训练任务,提高了跨模式特征对齐和融合,同时通过从语义掩蔽样本学习和新的成对排名损失增强三模式对齐。Clover 在多个下游任务中取得了新的最先进水平,包括零 - shot 和微调设置
→
PDF
2 years ago
Prev
Next