关键词multimodal retrieval
搜索结果 - 12
- AvaTaR:优化 LLM 代理以实现辅助工具的知识检索PDF17 days ago
- SIGIR文本 - 视频检索中的单查询后处理的 Sinkhorn 变换PDF8 months ago
- EMNLP大型语言模型和多模态检索在视觉词义消歧中的应用PDF8 months ago
- OpenFashionCLIP:基于视觉和语言的对比学习与开源时尚数据PDF10 months ago
- IPA-CLIP: 将音位预先设定集成到视觉和语言预先训练中PDFa year ago
- EMNLP文本 - 视频检索的标准化对比学习PDF2 years ago
- CVPR用于多通道视频 - 语言检索的预训练对比模型的快速适应PDF2 years ago
- EMNLPVisualSem: 一个高质量的视觉与语言知识图谱PDF4 years ago
- ECCVTVR: 视频字幕时刻检索大规模数据集PDF4 years ago
- ICCV基于自然语言查询的时空人员检索PDF7 years ago
- 用于高效跨模式检索的相关哈希网络PDF8 years ago
- ACL多语言多模态表征学习的桥式相关神经网络PDF9 years ago
Prev
Next