Feb, 2024
多模态学习稀疏检索与概率扩展控制
Multimodal Learned Sparse Retrieval with Probabilistic Expansion Control
Thong Nguyen, Mariya Hendriksen, Andrew Yates, Maarten de Rijke
TL;DR通过利用 Bernoulli 随机变量控制查询扩展,我们提出的训练算法能够有效减少高维共同激活和语义偏差,并在多模态设置中训练了一种有效的 LSR (learned sparse retrieval) 检索模型,该模型在训练时间和 GPU 内存需求方面优于现有的文本 - 图像 LSR 模型。