关键词modality gap
搜索结果 - 35
- ICML跨模态迁移的学习模态知识对齐PDF5 days ago
- 缓解差距:研究提升 CLIP 中跨模态对齐的方法PDF7 days ago
- 面向文本属性的隐式模态对齐的人物搜索PDFa month ago
- 文本反转与自监督精炼的放射学报告生成PDFa month ago
- 非模态鸿沟:对比鸿沟的特征与解决PDFa month ago
- SHE-Net:语法层次增强的文本 - 视频检索PDF2 months ago
- 两种效应,一个触发器:关于对比式视觉语言表示学习中的模态差异、物体偏见和信息不平衡PDF3 months ago
- CVPRSDSTrack: 自蒸馏对称适配器学习用于多模态视觉目标跟踪PDF3 months ago
- 填补视觉语言模型选择中的模态和容量差距PDF3 months ago
- CLEAR:基于预训练语言模型的交叉变压器在个人属性识别和检索中的应用PDF4 months ago
- Finer: 大规模视觉语言模型中细粒度视觉概念识别的研究与增强PDF4 months ago
- 逐步推进零尾到尾语音翻译的极限PDF5 months ago
- ICLR连接,塌陷,腐败:利用单模态数据学习跨模态任务PDF6 months ago
- 基于 CLIP 的可见光 - 红外人员再识别的语义发现网络PDF6 months ago
- AAAI通过仅文本训练挖掘细粒度的图像 - 文本对齐用于零样本字幕生成PDF6 months ago
- AAAI通过合成对的方法改善文本式图像描述的跨模态对齐PDF7 months ago
- CLIP 的零射类别视觉分类的内部模态代理学习PDF8 months ago
- ProtoHPE: 基于原型引导的高频补丁增强可见 - 红外人员再识别PDF9 months ago
- I2SRM: 跨样本关系建模用于多模态信息提取PDF9 months ago
- 基于文本 - only 训练实现的弱监督自动音频字幕生成PDF9 months ago
Prev