BriefGPT.xyz
Ask
alpha
关键词
multi-modal embedding
搜索结果 - 3
ACL
SemEval-2022 任务 5:多模态多变压器厌恶女性主义迷因分类框架的编解码器
该论文描述了他们在 SemEval 2022 竞赛的任务 5(多媒体自动仇恨辨别)中,构建通用框架以处理多模式嵌入和多标签二进制分类任务的工作。为了避免深度模型从零开始的资源和数据饥饿问题,作者采用三种主要策略,即组合不同的先进架构来捕捉来
→
PDF
2 years ago
麻省理工学院提出了新的多模态混合方法 —— 测地线多模态混合,以实现强化微调
本研究提供了一种理解多模态嵌入的视角,并提出了一种新的端到端微调方法,以鼓励更好的统一性和对齐得分,通过大量的检索、分类和结构感知任务的实验,证明了我们的地球多模态 Mixup 学习到了一个强健的表示,并在各种下游任务上提供了改进的性能。
PDF
2 years ago
CVPR
在汉堡中查找豆子:利用深度语义视觉嵌入实现定位
本研究提出了一种新的两条路径的神经网络,其中视觉路径采用了最新的空间感知池化机制模型,结合从头开始训练的文本路径,实现了一种多模态嵌入。在处理带有标注图像的任务中经过训练后,该模型可提供新的跨模态检索性能和短语的视觉定位,达到了最新的最佳表
→
PDF
6 years ago
Prev
Next