BriefGPT.xyz
Ask
alpha
关键词
multimedia information retrieval
搜索结果 - 2
多模态神经数据库
本文提出了一种新的框架,即多模态神经数据库(MMNDBs),用于回答涉及不同输入模式(如文本和图像)的复杂类似数据库的查询,通过多媒体信息检索和多模态深度学习技术的结合,MMNDBs 能够处理来自不同模式的非结构化数据,为该领域的未来研究铺
→
PDF
a year ago
MM
减少视觉和语言偏见以进行时间性句子定位
本文提出了一种消除多媒体信息检索中选择偏差的 Debiasing-TSG(D-TSG)模型,实现在常见和罕见情况下的 Temporal sentence grounding,在三个基准数据集上取得了最先进的表现。
PDF
2 years ago
Prev
Next