使用平滑相对遗憾逼近技术的主动学习及其应用
本文针对协作排名问题展开研究,通过基于凸优化的算法和AltSVM这种大规模非凸实现方式,实现从用户提供的两两偏好比较结果中预测他们对未曾见过物品的偏好,该算法展现出了在多个协作过滤数据集中NDCG和排名性能的许多中等规模基线的表现优势。
Jul, 2015
该研究提出了路面低秩(FLR)模型,通过矩阵完成技术和的 FLR 模型中的侧面信息开发 归纳成对排名(IPR)算法,在 FLR 模型下有证据表明它以样本高效的方式学习用于排名的 FLR 模型。
Feb, 2017
本研究旨在通过自适应挑选子集并收集偏好反馈,在Plackett-Luce模型下解决PAC排名问题,提出了新的pivot trick技巧,从而实现了在一定概率下识别n个项目的ε-最优排名,(m-1)/ m降低的样本复杂度和对称排名算法的阶无法提高的。
Oct, 2018
本研究探讨了在线偏好聚合的自然模型,使用广义Min-Sum-Set-Cover问题作为形式化模型,将排序降维到双重随机矩阵空间,并应用在线梯度下降技术以在多项式时间内实现GMSSC低遗憾学习,以提高学习效率。
Nov, 2020
提出了一种新的可微的代理损失函数PiRank,它使用基于NeuralSort的连续、温度控制放松来排序操作符,最终在公共互联网规模的学习排序基准测试中明显提高了可比较方法的性能。
Dec, 2020
活动学习是通过有选择性地请求标签以提高模型性能从而减少标注成本的一种有前途的范式。本研究提出了一种新的活动学习方法,通过一个学习的代理模型选择批次的未标记实例来进行数据获取,从而克服了现有活动学习方法所依赖于昂贵的获取函数计算、广泛的建模重训练和与注释者的多轮交互等局限性。
Oct, 2023
线性效用函数从成对比较查询中的可学习性研究。具体来说,我们考虑两个学习目标:首先是预测成对比较的样本外响应,其次是近似恢复效用函数的真实参数。我们证明在线性效用在被动学习设置下是高效可学习的,无论查询响应是否受到噪声干扰,并且在分布足够“好”的条件下,即使存在Tsybakov噪声。相比之下,我们证明对于一大类数据分布而言,在没有强建模假设的情况下,即使查询响应是无噪声的,效用参数也无法被学习。接下来,我们分析主动学习设置下的学习问题。在这种情况下,我们证明即使对于第二个目标,也可以高效学习,并提出了适用于无噪声和有噪声查询响应设置的算法。因此,我们的结果展示了成对偏好查询中被动学习和主动学习之间的质的可学习差距,展示了选择成对查询进行效用学习的价值。
May, 2024
我们研究了在主动学习过程中使用区域查询的复杂度与查询数量之间的权衡关系,并通过设计 VC 维度相关的查询方法来有效地学习。对于特定的假设类别,我们展示了更强的结果,包括计算效率和对未知数据集的适应性。
May, 2024
使用成员预测器解决未知线性约束的组合优化问题,以学习和利用替代线性约束的新框架,并通过采样策略和解决0-1整数线性规划来选择需要标记的新点,以提高结果的质量。
May, 2024