- CLEF-2019 CheckThat!:声明自动识别和验证概述
该论文总结了 CheckThat! Lab 在 CLEF 2019 中的活动,包含两种语言的两个任务,分别是对政治辩论或演讲中的声明进行事实核查的优先级预测 (Task 1) 和针对指定声明的事实核查,包括网页排名、分类、摘录及事实确定 ( - SIGIR基于参数密度估计的可扩展个性化物品排名
提出了一种基于概率密度的乘性正则化学习方法,并展示了该方法在真实数据集上优于点对和点值方法,这种方法可寻找到概率密度函数的最佳拟合,并使用最大似然估计得到负样本抽样分布,此外,该方法还具有很高的效率。
- SIGIR控制动态学习排序中的公平和偏见
该研究探讨了通过引入群组公平性来优化排序算法,以在双面市场被公正的利用,同时保证了理论和实践上的表现。
- AAAI基于知识的填空式多项选择题干扰项生成
本文提出一种新的可配置框架,用于自动为开放领域的填空式多项选择题生成干扰选项,该框架整合了通用知识库以有效地创建较小的干扰候选集,并使用功能丰富的学习排序模型来选择既合理又可靠的干扰选项。实验结果表明,我们的框架产生的干扰选项比以前的方法更 - 使用 TF-Ranking 中的 BERT 进行排序学习
该论文提出了一种利用 BERT 表示和 learning-to-rank 模型进行文档排序的机器学习算法。在公共基准测试中,采用这种方法可以取得更好的表现。最新的实验使用 RoBERTa 和 ELECTRA 模型,取得了较之其它方法更好的排 - WWW利用 Wikipedia 的层次化图嵌入在雅虎知识图谱中进行实体推荐
本文基于嵌入式实体推荐框架,将维基百科组织为一系列叠放在彼此之上的图表,从其拓扑和内容中学习互补实体表示,并结合轻量级的学习排序方法,为维基百科推荐相关实体。离线和在线评估显示,所得到的嵌入式表示和推荐效果良好。将简单性和质量相平衡,该框架 - EMNLP非二元世界:使用灰度数据进行学习排序以进行对话响应选择
本文提出一种利用现成的响应检索模型和响应生成模型来自动生成灰度数据并利用多级排序目标进行训练的方法,从而在建立基于检索的对话系统中提高响应选择的性能。实验表明,该方法能显著且一致地提高基于三个基准数据集和四种最先进的匹配模型的性能。
- WWW学习排序系统中的选择偏差校正
该研究考虑推荐系统中的不同偏差对算法性能的影响,提出新的反事实方法以解决位置和选择偏差,实验证明这些方法对噪声更具鲁棒性并具有更高精确度。
- SIGIRSetRank: 学习一种置换不变的信息检索排序模型
本论文提出了一个名为 SetRank 的新型神经学习排序模型,使用自我注意力机制和感知不变性来捕捉跨文档相互作用以及局部上下文信息,从而实现对任意大小文档集的置换不变性排名。与传统的学习排名模型和最先进的神经 IR 模型相比,经实验证明,S - 限制篇幅下 BERT 在非事实型问答中的研究
研究使用 BERT 进行非事实类问题回答,重点关注在不同文本长度下的文本重排任务。通过探索 BERT 在不同的排序方法下进行微调,包括逐点和逐对方法,在现有技术上取得了显着的进展。随后,分析了 BERT 在不同文本长度下的效果,并提出了如何 - IJCAI为提高文档摘要中的强化学习效率而进行的奖励学习
提出了一种新的基于强化学习的文档摘要算法 ——RELIS,它采用学习排序算法训练奖励函数,并在测试时使用该奖励函数来训练输入特定的强化学习策略,相比当下最先进的模型能够将训练时间缩短两个数量级并保持同样的性能,适用于多文档摘要。
- 基于片段的文档排序学习方法
本文研究使用文章中更多的信息以提高文档检索的效率, 作者设计了基于学习排名的文档检索方法,利用对查询的响应中生成的条目排名,其中一些方法量化文档的条目排名,另一些利用基于特征的条目表示法用于学习条目排名。实证评估证明了我们的方法在高效基线的 - 基于两两比较数据的解耦回归
提出了一种利用成对比较数据的非耦合回归方法,该数据由具有未知对应关系的未标记数据组成,可用于匿名目标预测,并且与使用有标记数据的监督学习相当,具有较广泛的应用范围。
- AAAI基于领域泛化视角的列表上下文建模
本文提出了一种领域泛化策略解决学习排名问题,使用 Query-Invariant Listwise Context Modeling (QILCM)神经架构,该架构通过学习查询不变的潜在表示来消除查询间的可变性,从而在基准数据集上比之前最先 - 排名公平性的政策学习
本文提出了一种利用随机排序策略来进行公平学习及考虑排序项影响的通用 LTR 框架,并通过基于政策梯度方法的 Fair-PG-Rank 算法进行优化,可在保持曝光公平性的情况下优化各种效用指标。通过实验结果验证了此方法在个人和集体公平性方面的 - 估计位置偏差,无需干扰干预
本文介绍了一种在不涉及人工参照或限制相关性建模假设的前提下,从历史反馈日志中收集一种特定类型的干预数据并使用极值估计器以获得一致倾向性估计的方法,该方法在 Arxiv 全文搜索和谷歌 Drive 搜索等两个实际系统中提供了更好的倾向性估计。
- Top-N-Rank:一种可扩展的面向推荐系统的列表排序方法
本论文提出了一种新的基于 Learning-to-Rank 方法的 Top-N-Rank 推荐算法,通过在排名列表中只评估前 N 个项目,消除评估低排名项目对学习排序函数的影响,并借助多种类型的隐式反馈来提高推荐质量,使用 ReLU 作为平 - KDD基于 TensorFlow 的排序学习可扩展库 TF-Ranking
TensorFlow Ranking 是第一个面向深度学习框架中解决大规模排名问题的开源库,可用于学习包含异构稠密和稀疏特征的用户活动数据的排序模型并在大规模搜索和推荐应用中取得良好效果。
- 使用深度神经网络学习群体多元评分函数
本研究提出了一种基于 groupwise scoring functions (GSFs) 的多元评分函数框架以改进排序学习,通过深度神经网络学习并在大规模商业邮箱数据集和公开基准数据集中得到了显著的性能提升。
- 基于语境的考察偏倚估计的干预收集
提出了一种基于上下文的地位模型(CPBM),使考试偏见可能依赖于描述查询和用户的上下文向量,并基于干预收获提出了有效的 CPBM 估计器,用于从搜索引擎和推荐系统的隐式反馈中进行无偏学习排序。在 ArXiv 搜索引擎上进行的实际实验以及在