BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-modality matching
搜索结果 - 3
野外匹配:学习用于多模态图像的解剖嵌入
为了解决不同 FOV 的图像对齐问题,本文提出了一种名为 Cross-SAM 的新方法,该方法利用嵌入学习和 CT-MRI 注册的迭代过程,以实现跨模态匹配,并在 CT-MRI 仿射注册数据集上表现出鲁棒性,明显优于其他方法,达到了最先进的
→
PDF
a year ago
ACL
探究位置信息在视觉语言模型中的作用
研究了视觉语言模型中的位置信息对图像 - 文本匹配任务的影响,并提出了两种解决策略,即位置信息预训练和基于交叉模态匹配的对比学习。结果显示,即使位置信息存在,模型仍不能正确地分类具有详细位置语句的图像。
PDF
a year ago
面向可见光红外人员再识别的同质化模态学习和多粒度信息探索
本文提出一种基于 Aligned Grayscale Modality (AGM) 的跨模态人员重识别方法,通过生成灰度可见光图像和风格迁移转换红外图像得到一致的数据,再结合多颗粒度特征提取网络在特征级别进行对齐,能够显著提高跨模态检索表现
→
PDF
2 years ago
Prev
Next