关键词multimodal retrieval
搜索结果 - 12
  • AvaTaR:优化 LLM 代理以实现辅助工具的知识检索
    PDF17 days ago
  • SIGIR文本 - 视频检索中的单查询后处理的 Sinkhorn 变换
    PDF8 months ago
  • EMNLP大型语言模型和多模态检索在视觉词义消歧中的应用
    PDF8 months ago
  • OpenFashionCLIP:基于视觉和语言的对比学习与开源时尚数据
    PDF10 months ago
  • IPA-CLIP: 将音位预先设定集成到视觉和语言预先训练中
    PDFa year ago
  • EMNLP文本 - 视频检索的标准化对比学习
    PDF2 years ago
  • CVPR用于多通道视频 - 语言检索的预训练对比模型的快速适应
    PDF2 years ago
  • EMNLPVisualSem: 一个高质量的视觉与语言知识图谱
    PDF4 years ago
  • ECCVTVR: 视频字幕时刻检索大规模数据集
    PDF4 years ago
  • ICCV基于自然语言查询的时空人员检索
    PDF7 years ago
  • 用于高效跨模式检索的相关哈希网络
    PDF8 years ago
  • ACL多语言多模态表征学习的桥式相关神经网络
    PDF9 years ago
Prev
Next