Sep, 2023

冷启动场景下的统一搜索和推荐基础模型

TL;DR在现代商业搜索引擎和推荐系统中,数据来自多个领域被用于联合训练多领域模型。使用大型语言模型,提出了一种名为S&R Multi-Domain Foundation的新型框架,其中利用LLM提取领域不变的文本特征,并使用Aspect Gating Fusion将ID特征、领域不变的文本特征和任务特异性稀疏特征合并以获得查询和项的表示。同时,使用领域自适应多任务模块联合训练来自多个搜索和推荐场景的样本,获得多领域基础模型。将S&R Multi-Domain Foundation模型应用于冷启动场景中,以pretrain-finetune方式取得比其他SOTA迁移学习方法更好的性能。S&R Multi-Domain Foundation模型已成功部署在支付宝移动应用的在线服务中,如内容查询推荐和服务卡片推荐等。