关键词modality alignment
搜索结果 - 10
- CVPRMA-AVT:用于参数高效音频 - 视觉变换器的模态对齐PDF25 days ago
- 通过自我改进增强大型视觉语言模型中的视觉 - 语言模态对齐PDFa month ago
- ViT-Lens-2: 通往全模态智能的入口PDF7 months ago
- u-LLaVA: 通过大型语言模型统一多模态任务PDF8 months ago
- 多路适配器:为可扩展的图像 - 文本检索适应大规模多模态模型PDF10 months ago
- BLSP:基于继续写作行为对齐的语音 - 文本预训练引导PDF10 months ago
- 利用精细语义奖励提升文本到图像扩散模型PDFa year ago
- G2DA: 基于几何引导的双重对齐学习用于 RGB - 红外人员再识别PDF3 years ago
- 寻找声音的形状:学习声音 - 面孔关联的自适应框架PDF3 years ago
- 基于多视角注意力网络的视觉对话PDF4 years ago
Prev
Next