基于多任务表现的专家活跃排名
本研究旨在通过自适应挑选子集并收集偏好反馈,在 Plackett-Luce 模型下解决 PAC 排名问题,提出了新的 pivot trick 技巧,从而实现了在一定概率下识别 n 个项目的 ε- 最优排名,(m-1)/m 降低的样本复杂度和对称排名算法的阶无法提高的。
Oct, 2018
文中提出了一种基于序列或主动排名的算法,该算法基于嘈杂的成对比较将一组 n 个项目排名并将这些项根据其得分分成预先指定大小的集合;本文针对这种算法进行了分析,证明了在某些情况下具有最优性并且不需要任何假设,比如在参数模型下进行的排名。
Jun, 2016
优化用户排序列表的算法将用户偏好和物品位置的变化考虑在内,通过上界调整预测的用户满意度分数,并选择最大化这些调整分数的排序操作,以在异质用户中个性化用户体验。该算法在实验中表现优于基线模型。
Jun, 2024
本文研究了一种在线学习算法,该算法将多个专家的预测结果融合为一个预测结果以提高准确性,并利用特定结构的效用函数设计了激励兼容性和无悔策略两个要求的算法,以应对专家可能误导算法的情况。
May, 2023
设计在线算法,利用机器学习预测,以超越最坏情况范例,解决各种实际相关在线问题(如调度、缓存、聚类、滑雪租赁等)。通过研究设计具备多个专家的在线算法,以超越静态最佳专家的贪心基准。在新的动态基准中提出了具有 O(log K)性能保证的竞争算法,其中 K 是专家数量,适用于 0-1 在线优化问题。此外,我们的多专家方法提供了一种在线组合多个在线算法的新视角,这是在线算法研究社区长期的核心主题。
Dec, 2023
该研究提出了在缺乏任务相似性和任务特征的条件下,通过多任务学习获得的置信区间,可以有效地估计多个相关任务的不确定性,并且可以应用于在线学习中,进一步提出了一种新颖的多任务主动学习算法来同时优化多个任务,通过使用置信区间决定选择哪个任务进行查询,并通过合成和真实世界数据验证了算法和界限的有效性。
Aug, 2023
本文考虑众包任务分配中的可靠性问题,提出了一种基于置信传播和低秩矩阵逼近的算法来决定如何分配任务,并从工人的答案中推断出正确答案。比较了不同算法的表现,发现基于者非自适应的算法是最优的。此外,还强调了建立可靠的工人信誉系统对于完全运用自适应设计的潜力至关重要。
Oct, 2011
本研究介绍了一种基于 Lipschitz bandit 和代理损失的在线学习算法,使用有偿随机专家进行在线分类决策,并与标准 Lipschitz bandit 设置相比,总成本在 T 轮后不超过预测器的成本上限。
Jul, 2023
本研究探讨了一种在线学习算法,使用新颖的 Top-1 反馈模型,评估对多样性兴趣用户的固定排名商品排名能力,并证明了其对于几种流行的排名度量具有最小化后悔的能力。
Oct, 2014
本文提出了一种基于 Mann Whitney U 统计量的公平性学习方法,用于多任务回归模型的训练,通过非凸的优化和个体排名函数的分组排名功能的定义来提高性能。实验结果验证了本方法的出色表现。
Sep, 2020