凸集机器学习建议的在线资源分配
给定未知质量的预测作为输入,我们提出了一种算法,在未知预测质量和请求模型的情况下,在在线资源分配问题中实现了渐进最优表现,验证了算法的性能与任何已知到达模型和预测准确性的算法的最佳性能相匹配。
Feb, 2024
本文提出一种针对多个资源分配问题的算法体系,将在线请求建模为每次从未知的概率分布中独立抽取,给出了一个在任意接受数据的情况下获得一定比例最优解的单一算法,并且探究了如何在任意情况下应对敌对分布。同时,文中提出了解决大型 LPs 混合装填覆盖问题的快速算法,并分析了该算法在在线拍卖、网络路由和广告策略方案等特殊情况下的应用。
Mar, 2019
该研究考虑了在线计算的建议模型下,建议来源于不受信任的源头所带来的影响,并以滑雪租赁、装箱问题等在线问题为研究对象,得出了根据建议是否可信获得最差情况下的竞争性质算法的结论,解决了现有模型无法解决的差异化问题。
May, 2019
研究了在线分配问题,通过创建不对称性来控制重用性引起的随机依赖,并建立了一个新算法,获得了最佳竞争比率。(The paper studies the problem of online allocation and proposes a new algorithm that creates asymmetry to control the stochastic dependencies induced by reusability, achieving the best possible competitive ratio.)
Feb, 2020
我们探索了一种用于动态公平资源分配问题的主动学习方法,该方法假设在在线资源分配过程的每个时期,仅从选择的代理人子集中获取反馈。尽管存在这种限制,我们提出的算法在包括资源分配问题中常用的公平度量和匹配机制中的稳定性考虑等各种度量中,提供了与时间周期数次线性相关的后悔界限。我们算法的关键洞察在于通过利用对决性的上限和下限置信区间来自适应地识别最具信息量的反馈。通过这种策略,我们证明高效的决策不需要大量的反馈,并为各种问题类别产生高效的结果。
Jun, 2024
该论文提出了一种将偏好学习整合到追索生成问题中的两步方法,通过设计问答框架来逐步细化追索主体的马氏矩阵代价的置信集,然后利用基于梯度和基于图的代价自适应追索方法来生成合法且考虑到整个代价矩阵的高效追索,数值评估结果表明该方法在提供高效追索建议方面优于现有基准。
Feb, 2024
本文探讨了在不观察个体保护属性的情况下,使用不同质量的数据源估算这些属性以降低公平惩罚的在线分配问题,并提出了一种在多臂赌博问题的框架下同时解决两个问题的算法,该算法可以适应多种不同的公平概念,并且在一些情况下可以学习使用的估计值。
Jun, 2023
我们在本文中解决了一种带有任务转移的在线网络资源分配问题,提出了基于指数加权方法的随机在线算法,证明了该算法具有次线性时间后悔,通过对人工数据进行性能测试并与强化学习方法进行比较表明我们的方法优于后者。
Nov, 2023
本文提出了一种基于多目标强化学习的公平感知的推荐框架(MoFIR),能够以单参数表示形式学习所有可能偏好的最优推荐策略,并在多个真实推荐数据集上的实验中验证了其在公平指标和推荐度量方面的优越性。
Jan, 2022