- LiPO: 基于学习排序的列表偏好优化
使用 Listwise Preference Optimization 框架对语言模型进行排名问题的对齐,将 LiPO-λ 方法与传统的 DPO 和 SLiC 方法相比,在两项偏好对齐任务中明显表现更好。
- 学习排序中模拟退火特征选择的探索性研究
我们研究了在学习排序领域中使用模拟退火这一流行的元启发式方法进行特征选择,包括不同的邻域选择策略、温度冷却方案和进度参数等,通过在五个公开基准数据集上进行实验对比,证明了我们提出的模型的有效性。
- 自适应神经排序框架:面向级联排序系统的最大化业务目标
级联排序在在线广告和推荐系统中被广泛应用于大规模前 k 选择问题,而学习排序是优化级联排序系统模型的重要方法;本文提出了一种新颖的适应级联排序系统的优化目标的方法,通过多任务学习框架自适应地结合放松和完整优化目标的优化;并且引入置换矩阵表示 - 基于组公平的 Plackett-Luce 排名模型的相关性和事后公平优化
在学习排序(LTR)中,为了确保排名结果的后验公平性,提出了一种新的目标函数,通过性能约束来最大化预期相关性。该方法在 LTR 框架中构建了一个组内公平的 Plackett-Luce 模型,并展示了在三个真实数据集上的实验证明了其相比 LT - 用排列替代评分:一种上下文集合排列学习排序的框架
STARank 是一种新的学习排名框架,可以直接生成候选项的排列而无需单独评分和排序,旨在解决学习排名任务中的问题。与现有的基于概率排序原则的解决方案相比,STARank 在性能上表现更加优越。
- ICML预训练深度模型在标签稀缺的学习排序中胜过 GBDT
该论文研究了无监督预训练是否能提高在标注数据远远少于非标注数据情况下的 LTR 问题中的性能,并通过使用特定于排序的改进方法,在无监督预训练的深度学习模型中表现出比 GBDT 和其他非预训练模型更好的性能,并且在排名异常数据方面也通常具有显 - 为动态个性化的拼车服务设计的机器学习排名算法
本文提出了 GoTogether, 一种基于学习排序技术的拼车推荐系统,通过用户历史选择建立个性化排序模型并最大化成功匹配的推荐,实验结果表明在静态和动态情况下该方案能快速准确预测用户选择。
- THUIR2 参加 NTCIR-16 Session Search (SS) 任务
THUIR2 team describe their approach and results in NTCIR-161 Session Search Task, achieving best performance using learn - 生成式检索中的学习排序
提出了一个称为 LTRGR 的新框架,结合了生成式检索和经典的学习 - 排序模型,通过使用段落排名损失训练自回归模型,只需要额外的训练步骤即可增强当前的生成式检索系统,并在三个公共数据集上实现了最先进的性能。
- 考分重要时的排序学习
本文通过研究采用分级标签的学习排序问题,提出了一种多目标结构,能够在优化排序性能和等级预测性能方面取得比其他方法更好的结果,证明了利用序数级别信息的好处。
- KDDRankFormer:采用列表标签的列表排序学习
提出使用 RankFormer 架构来从用户的绝对反馈中学习列表的总体质量并优化排序,模拟的公共数据集与 Amazon 搜索数据集的离线实验结果表明 RankFormer 优于所有基线;通过知识蒸馏可立即在在线实验中使用
- 将结构知识纳入预训练语言模型,用于法律案例检索:THUIR@COLIEE 2023
本研究总结了 2023 年 COLIEE 中冠军团队 THUIR 的方法,其中使用结构感知的预训练语言模型来加强对法律案例的理解,借助启发式预处理和后处理方法减少不相关信息的影响,并利用学习排序的方法来合并具有不同维度的特征,实验证明了该方 - 重新审视相似性和不相似性在最佳反驳论点检索中的作用
本文提出了一种基于 Bert 的新模型 Bipolar-encoder,通过相似度和不相似度度量来评分反驳论证,并通过实验证明了其比传统方法和最近的神经评分模型更加有效和高效。
- 使用 GNN 进行资源排序学习
本文提出了一种基于图神经网络的学习排序方法来解决分布式信息检索系统中资源选择的问题,通过使用预训练语言模型来获取查询和资源的语义信息,并建立异构图来保留查询 - 资源结构信息并提取结构信息。在基准数据集上的实验表明,该方法在资源选择方面具有 - ImitAL: 在合成数据上学习的主动学习策略
本文介绍了一种领域无关的主动学习(Active Learning)查询策略 ImitAL,使用学习排序(Learning-to-rank)方法编码 AL,通过大规模模拟运行在纯合成数据集上进行训练,成功地通过与其他 7 种查询策略在 13 - 在线群体决策对话中的思维改变机制:实证研究
研究人员使用神经文本分类和学习排序训练等技术,探究在人们在讨论会议或面试小组中如何改变想法的方法,并发展出一些改变想法的指标。
- SIGIR采样加速排名学习:最小计算复杂度的 Plackett-Luce 梯度估计
本文介绍 PL-Rank-3 算法,该算法具有可比较于最佳排序算法的计算复杂度,并且可以在任何标准排序可行的情况下应用于学习排序领域。该算法能够通过无偏梯度估计提高优化时间,而不损失性能。
- ACL通过自然语言推理的间接监督进行超细实体类型标注
LITE is a natural language inference-based approach for ultra-fine entity typing, addressing the data scarcity issue and - AAAI一种利用排序学习蒸馏的高效组合优化模型
本文介绍了基于学习排序蒸馏的组合优化问题解决方法,其中高性能排序策略通过强化学习可以被提炼成非迭代简单模型,从而实现低延迟的拟合,通过优化推理效率和性能表现,证明了这一框架的优势。
- ICML基于学习排序的决策导向学习
该研究提出了一种基于机器学习模型的决策学习方法,将预测转化成离散组合优化问题的目标函数的代价系数,并提出了一种新的噪声对比度估计损失函数,将决策学习作为学习排名问题,实现对最优解的链式排序,并通过实验检验了其优越性。