BriefGPT.xyz
大模型
Ask
alpha
关键词
joint embedding
搜索结果 - 5
CVPR
ImageBind: 一个绑定所有嵌入空间的嵌入空间
ImageBind 是一种学习跨六种不同类型数据(图像、文本、音频、深度、热成像和 IMU 数据)联合嵌入的方法,只需使用图像数据对它们进行绑定。它能够实现跨模态检索、跨模态检测和生成等新颖的应用,而且表现出强大的零样本和有限样本识别能力,
→
PDF
a year ago
KDD
多模态单细胞数据集成的图神经网络
本文介绍了一种名为 scMoGNN 的图神经网络框架,用于多模态单细胞技术数据的模态预测,模态匹配和联合嵌入,取得了 SOTA 的成果,并在 NeurIPS 2021 竞赛中获胜,所有实现都已整合到 DANCE 软件包中。
PDF
2 years ago
AAAI
联合嵌入镜头下的情感分析
本文通过联合嵌入技术 (JE) 进行 Meme 情感分析,结果较之前技术略有提升,旨在解决 Meme 在社交媒体上传播仇恨和虚假信息等问题。
PDF
3 years ago
ICCV
凝固的时间:一种用于端到端检索的联合视频和图像编码器
本研究目标是视频文本检索 - 特别是一种联合嵌入,可以实现高效的文本到视频检索。作者们提出了一种端到端可训练的模型,旨在利用大规模的图像和视频字幕数据集。该模型是近期 ViT 和 Timesformer 框架的改进扩展,包括时间和空间方面的
→
PDF
3 years ago
ICCV
CAMP: 文本 - 图像检索的跨模态自适应消息传递
本文提出了一种跨模态自适应信息传递模型(Cross-modal Adaptive Message Passing, CAMP),通过自适应地控制跨模态信息的流动,全面且精细地考虑跨模态交互,使用硬负样本二元交叉熵损失函数进行训练,在 COC
→
PDF
5 years ago
Prev
Next