Oct, 2023

语言模型作为语义索引器

TL;DR本文介绍了 LMINDEXER,一种自我监督框架,用于学习语义标识符,该方法能够处理顺序离散标识符的挑战,并通过生成性语言模型和自监督文档重构目标进行训练,从而改善了语义监督不足的问题。通过在不同领域的五个数据集上进行实验证明,LMINDEXER 在推荐、产品搜索和文档检索等多个任务上显著且一致地优于竞争性基准方法。