关键词semantic alignment
搜索结果 - 46
  • MASA: 带有语义对齐的运动感知遮挡自编码器用于手语识别
    PDFa month ago
  • 超越融合:一种用于遥感图像 - 文本检索的多尺度对齐方法
    PDFa month ago
  • C3LLM: 使用大型语言模型的条件多模式内容生成
    PDFa month ago
  • 全局 - 局部语义一致学习的文本 - 视频检索
    PDFa month ago
  • LGTM: 本地到全局的文本驱动人体运动扩散模型
    PDF2 months ago
  • CVPR 2024 NICE 挑战赛技术报告:使用集成 CLIP 和共识得分进行字幕重新排名评估
    PDF2 months ago
  • 利用图生成提升领域自适应物体检测
    PDF2 months ago
  • OPTiML: 自我监督医学图像表示中的稠密语义不变性应用最优传输
    PDF2 months ago
  • CVPR弱监督参照图像分割的课程点提示
    PDF2 months ago
  • 无噪声标签的交叉模态检索的统一最优传输框架
    PDF3 months ago
  • 探索预训练的文本到视频传播模型用于视频对象分割
    PDF3 months ago
  • 走向全面多模感知:引入触觉 - 语言 - 视觉数据集
    PDF4 months ago
  • 逆转 CLIP 模型带给我们什么启示?
    PDF4 months ago
  • ICLR跨模态语境扩散模型的文本导向视觉生成与编辑
    PDF4 months ago
  • 培养多轮思维的文本引导图像生成
    PDF6 months ago
  • 精细的外观转换模型
    PDF7 months ago
  • 一图胜千言:原则性重描述提升图像生成
    PDF8 months ago
  • 扩展多模态对比表示
    PDF9 months ago
  • 通过翻译跟随示范提升面向指导训练大型语言模型的跨语言能力
    PDF10 months ago
  • ICCV基于语义聚类的点云视频自监督学习的点对比预测
    PDF10 months ago
Prev