BriefGPT.xyz
Ask
alpha
关键词
downstream cross-modal tasks
搜索结果 - 2
ACL
利用伪造的图像标题进行多模态摘要
本文从互信息优化的角度研究了负样本对视觉语言预训练中交叉模态对比学习的影响,并提出了一种渐进式改进的交叉模态相似度对比学习策略,在理论指导下实现了对 (部分) 假负例样本有益和有害效应的平衡,这种方法在四个下游交叉模态任务中表现良好。
PDF
a year ago
通过交叉模态相似度调节的对比学习进行视觉语言预训练
本文从互信息(MI)优化的角度研究了预训练中视觉语言交互 (VLP) 面临的(部分)误负样本的挑战,并提出了一种被逐步优化的跨模态相似性约束下的对比学习策略来更加准确地优化图像 / 文本锚点与其负样本的 MI,从而在四个下游跨模态任务中具有
→
PDF
a year ago
Prev
Next