Apr, 2024

De-DSI: 分散可微搜索索引

TL;DRDe-DSI 是一种新颖的框架,通过将大型语言模型(LLMs)与信息检索真正的分布式化相结合,特别是在分布式环境中采用可微分搜索索引(DSI)的概念,以有效地将新颖的用户查询与文档标识符连接起来,在仅使用查询 - 文档标识符对上进行操作。该框架通过引入 DSI 模型的集合来提高可扩展性,其中数据集被分割为较小的片段进行单独的模型训练。通过使用波束搜索来识别顶级文档标识符并应用 softmax 函数进行评分归一化,从而选择具有最高得分的文档进行检索。该分布式实现表明检索成功率与集中式方法相当,同时具有将计算复杂性分布到网络中的额外好处。该设置还允许通过磁力链接检索多媒体项目,消除了平台或中介的需求。