在线装箱的简化学习增强算法与凹函数目标
本文介绍了在学习增强的在线算法中使用回归技术来预测未来输入参数的方法,并在广义滑雪租赁、装箱问题、最小完成时间调度等一般在线搜索方案的背景下探讨了这种方法。通过在设计回归问题的损失函数中结合在线优化基准,我们显示了这种回归问题样本复杂度的近似上下界,并将我们的结果扩展到了不可知设置。
May, 2022
在线背包问题的学习增强算法通过使用简洁的预测信息,在无传递完美预测和有限完美预测两种情况下,设计了能够提高算法性能的算法,并在实验中表现优于基线和复杂预测模型的算法。
Jun, 2024
本文介绍了在线学习的基本概念和现代在线凸优化的视角,并针对凸丢失,在欧几里得和非欧几里得环境中介绍了一阶和二阶算法。同时,还特别关注了算法参数调优和在无界域上的学习,并介绍了对非凸损失的处理方法和信息缺失的决策问题中的多臂赌博机问题。
Dec, 2019
本文研究在线问题中的线性规划问题,提出了解决混合 packing 和 covering 约束线性规划在线问题的算法,并应用于两个与机器调度和设施定位相关的问题,得到了多项式对数竞争积分解决方案。
Mar, 2012
本文提出了解决约束在线凸优化问题的框架。通过将问题转化为在线凸 - 凹优化问题,提出了一种有效的算法,可以实现收敛性较好的结果。同时,本文还为从中提取多点强化信号的约束在线凸优化问题提供了解决方案。
Nov, 2011
本研究分析了在线凸优化问题在不同情境下的处理方法,并在具有完全适应性对手的在线线性优化算法为在线凸优化算法提供了一个模板,同时将需要完全信息反馈的算法转换为具有相近遗憾界限的半强盗反馈算法。此外,通过对半强盗反馈中使用确定性算法的完全适应性对手和使用随机算法的毫无意识对手进行比较,我们证明了可以在面对不可避免对手时,设计针对完全适应性对手的算法使用仅具有随机半强盗反馈也能获得类似界限。基于此,我们提出了将一阶算法转换为零阶算法,并具有相近遗憾界限的通用元算法框架。我们的框架允许在不同情境下分析在线优化,如全信息反馈、强盗反馈、随机遗憾、对手遗憾和各类非稳定遗憾。利用我们的分析,我们提供了第一个使用线性优化预言机的无投影在线凸优化算法。
Feb, 2024
本文针对凸无约束优化问题提出了一种新方法,通过一种自适应学习率规则和线性耦合两个序列的方式,利用重要权重和自适应在线学习算法的思想实现了对光滑目标、非光滑一般情况和随机优化的加速收敛。实证分析表明了本方法在上述场景中的适用性并证实了我们的理论发现。
Sep, 2018
该研究提出一种利用机器学习建议进行在线资源分配决策的框架,算法类似于一种 Pareto 最优算法,它能够在机器学习建议存在不准确性的情况下,在保证一定的性能准则的前提下尽量提高稳健比率,最终证明与基准算法相比,该算法能够在最坏和平均情况之间实现平衡,并且获得更好的性能。
Jun, 2023