关键词cross-modal learning
搜索结果 - 26
  • 通过语音文本对齐提升多语言语音有害性检测
    PDF20 days ago
  • CVPRAVFF:音视特征融合用于视频深度伪造检测
    PDFa month ago
  • 多模态元学习中使用条件批量归一化的辅助任务调节的限制
    PDFa month ago
  • NeRAF:三维场景中嵌入的神经辐射和声场
    PDFa month ago
  • CoLeaF: 一个对比 - 协同学习框架,用于弱监督音频 - 视觉视频解析
    PDF2 months ago
  • 考虑 Wasserstein 图匹配的半监督图像描述
    PDF3 months ago
  • 通过高效的跨模态扩散模型实现密集准确的雷达感知
    PDF4 months ago
  • 可靠的时空体素用于多模态测试时适应
    PDF4 months ago
  • 通过无需训练的码书优化和分层对齐发掘多模态统一离散表示的潜能
    PDF4 months ago
  • 指令引导的场景文本识别
    PDF5 months ago
  • 瓶颈模型中的跨模式概念化
    PDF8 months ago
  • ICCVBEV-DG: 基于鸟瞰图的跨模态学习用于 3D 语义分割领域泛化
    PDFa year ago
  • ICML健康时间序列的多模态自监督学习中的潜变量屏蔽
    PDFa year ago
  • 艺术生成的扩散式创意探索
    PDFa year ago
  • 基于维度结构的跨模态学习知识蒸馏方法
    PDFa year ago
  • 一种新的多模态命名实体识别框架,具有多级对齐
    PDFa year ago
  • 使用 CLIP 引导的视觉文本注意力进行视频问答
    PDFa year ago
  • Hidden Gems: 使用跨模态监督的 4D 雷达场景流学习
    PDFa year ago
  • 音乐对比语音学习
    PDF2 years ago
  • Zero and R2D2: 一个大规模的中文跨模态基准和视觉语言框架
    PDF2 years ago
Prev