BriefGPT.xyz
Ask
alpha
关键词
language processing pipelines
搜索结果 - 1
语言模型的策略梯度训练方法用于排名
通过利用大规模预训练语言模型,我们引入了一种名为 Neural PG-RANK 的新型训练算法,该算法通过实例化一个语言模型为 Plackett-Luce 排序策略,为检索模型的端到端训练提供了一种合理的方法,并有效地将训练目标与下游决策质
→
PDF
9 months ago
Prev
Next