凸集机器学习建议的在线资源分配

Jun, 2023

凸集机器学习建议的在线资源分配

Online Resource Allocation with Convex-set Machine-Learned Advice

Negin Golrezaei, Patrick Jaillet, Zijie Zhou

TL;DR该研究提出一种利用机器学习建议进行在线资源分配决策的框架，算法类似于一种 Pareto 最优算法，它能够在机器学习建议存在不准确性的情况下，在保证一定的性能准则的前提下尽量提高稳健比率，最终证明与基准算法相比，该算法能够在最坏和平均情况之间实现平衡，并且获得更好的性能。

Abstract

Decision-makers often have access to a machine-learned prediction about demand, referred to as advice, which can potentially be utilized in online decision-making processes for resource allocation. However, exploiting such advice poses challenges due to its potential inaccuracy. To address this issue, we propose a framework that enhances →

machine learning online resource allocation pareto optimal algorithm performance

发现论文，激发创造

两个世界中的最佳选择：在未知到达模型下的在线资源分配与预测

给定未知质量的预测作为输入，我们提出了一种算法，在未知预测质量和请求模型的情况下，在在线资源分配问题中实现了渐进最优表现，验证了算法的性能与任何已知到达模型和预测准确性的算法的最佳性能相匹配。

Feb, 2024

学习增强在线算法的最优韧性 - 一致性平衡

研究如何将机器学习预测融入在线算法以提高性能，并提供非平凡的下界来衡量竞争分析的最优权衡.

Oct, 2020

资源分配问题的近最优在线算法和快速近似算法

本文提出一种针对多个资源分配问题的算法体系，将在线请求建模为每次从未知的概率分布中独立抽取，给出了一个在任意接受数据的情况下获得一定比例最优解的单一算法，并且探究了如何在任意情况下应对敌对分布。同时，文中提出了解决大型 LPs 混合装填覆盖问题的快速算法，并分析了该算法在在线拍卖、网络路由和广告策略方案等特殊情况下的应用。

Mar, 2019

在线计算与不可信的建议

该研究考虑了在线计算的建议模型下，建议来源于不受信任的源头所带来的影响，并以滑雪租赁、装箱问题等在线问题为研究对象，得出了根据建议是否可信获得最差情况下的竞争性质算法的结论，解决了现有模型无法解决的差异化问题。

May, 2019

在线可重用资源的渐进最优竞争比率分配

研究了在线分配问题，通过创建不对称性来控制重用性引起的随机依赖，并建立了一个新算法，获得了最佳竞争比率。(The paper studies the problem of online allocation and proposes a new algorithm that creates asymmetry to control the stochastic dependencies induced by reusability, achieving the best possible competitive ratio.)

Feb, 2020

公平稳定的在线分配的主动学习

我们探索了一种用于动态公平资源分配问题的主动学习方法，该方法假设在在线资源分配过程的每个时期，仅从选择的代理人子集中获取反馈。尽管存在这种限制，我们提出的算法在包括资源分配问题中常用的公平度量和匹配机制中的稳定性考虑等各种度量中，提供了与时间周期数次线性相关的后悔界限。我们算法的关键洞察在于通过利用对决性的上限和下限置信区间来自适应地识别最具信息量的反馈。通过这种策略，我们证明高效的决策不需要大量的反馈，并为各种问题类别产生高效的结果。

Jun, 2024

自适应偏好引导下的成本适应型补救推荐

该论文提出了一种将偏好学习整合到追索生成问题中的两步方法，通过设计问答框架来逐步细化追索主体的马氏矩阵代价的置信集，然后利用基于梯度和基于图的代价自适应追索方法来生成合法且考虑到整个代价矩阵的高效追索，数值评估结果表明该方法在提供高效追索建议方面优于现有基准。

Feb, 2024

在在线分配中平衡价格与数据质量以实现公平

本文探讨了在不观察个体保护属性的情况下，使用不同质量的数据源估算这些属性以降低公平惩罚的在线分配问题，并提出了一种在多臂赌博问题的框架下同时解决两个问题的算法，该算法可以适应多种不同的公平概念，并且在一些情况下可以学习使用的估计值。

Jun, 2023

网络资源分配的在线优化及与强化学习技术的比较

我们在本文中解决了一种带有任务转移的在线网络资源分配问题，提出了基于指数加权方法的随机在线算法，证明了该算法具有次线性时间后悔，通过对人工数据进行性能测试并与强化学习方法进行比较表明我们的方法优于后者。

Nov, 2023

通过强化学习实现帕累托有效的公平效用权衡推荐

本文提出了一种基于多目标强化学习的公平感知的推荐框架（MoFIR），能够以单参数表示形式学习所有可能偏好的最优推荐策略，并在多个真实推荐数据集上的实验中验证了其在公平指标和推荐度量方面的优越性。

Jan, 2022