- 在无先验知识的平均奖励马尔可夫决策过程中寻找良好的策略
我们回顾平均奖励马尔可夫决策过程(MDP)中 ε- 最优策略的识别,并提出了一种新算法,在小 ε 范围内其样本复杂度为 SAD/ε^2;此外,我们还提出了一种在线算法,其样本复杂度为 SAD^2/ε^2,并且提出了一种有前景的基于数据相关的 - 改进的多臂赌博机问题的近乎紧密逼近保证
我们对改进的多臂赌博机问题给出了近似最优的上下界。我们证明了对于任何随机在线算法,存在一个实例使其相对于最优收益至少有一个 Ω(√k) 的近似因子。然后,我们提供了一个随机在线算法,在事先告知最优臂可达到的最大收益的情况下,保证了一个 O - 适应能量受限的无线边缘网络的自适应分割学习
我们设计了一种自适应分裂学习(ASL)方案,该方案可以在无线边缘网络中为设备动态选择分裂点并为服务器分配计算资源,以减少训练延迟和能量消耗。采用在线算法 OPEN 和两层优化方法解决优化问题,该方案相比现有的分裂学习方案,平均减少了 53. - 有限覆盖混合强化学习的在线算法的自然推广
混合强化学习利用在线和离线数据,研究其可证明的好处仍然很少,通过将状态 - 动作空间分区和在线算法温启动离线数据,我们证明了混合强化学习算法的遗憾可以通过最佳分区来表征,从而在探索方面取得可证明的增益。
- AAAI学习增强的二层滑雪租赁问题的在线算法
我们研究了两层滑雪租借问题,其中用户需要通过选择三个支付选项之一来满足多个项目的一系列需求:按需使用支付(即租赁),购买单个项目(即单独购买)和购买所有项目(即组合购买)。我们设计了一种稳健的在线算法(RDTSR),它能提供最坏情况下的性能 - 时态图中的节点特征预测的在线算法
我们在这篇论文中提出了一种名为 “mspace” 的在线算法,用于预测时态图中的节点特征,该算法巧妙地捕捉到不同节点之间的空间交叉相关性以及节点内部的时间自相关性。与基于图神经网络(GNN)模型和传统卡尔曼滤波器等各种基准方法进行了比较评估 - MM具有单调对手的对决优化
用一个在线算法设计 dueling optimization 问题的最优解,最小化迭代复杂度和总成本。
- 带预测内容的在线强盗学习
我们考虑了上下文强盗问题,在每个时间点上,代理只能访问上下文的嘈杂版本和误差方差(或该方差的估计)。我们提出了第一个在线算法,与适当的基准相比,在此设置中具有亚线性遗憾,其关键思想是将经典统计中的测量误差模型延伸到在线决策情境中,这是一个非 - 在线库存问题:在线凸优化中超越 i.i.d. 设置
研究了多产品库存控制问题,提出了 MaxCOSD 在线算法,可实现对非 i.i.d 需求和有状态动态的问题进行有效控制。
- 快速子模函数最大化
本研究提出了一种基于新型搜索树数据结构的算法,可以高效地计算在线和离线子模函数最大值问题。
- 动态过程限制的实时离群值检测
本文提出了一种基于逆累积分布的在线异常检测算法,用于现有实时基础设施中低延迟检测,适用于不可预测的数据模式,并在两个实际微电网操作数据案例中展示了易于使用、快速计算和可部署的优势。
- 在线 2 阶段稳定匹配
实现一个可实现在线算法,并通过该算法最小化两种稳定匹配之间的更改和离婚数量,该算法适用于大学招生和稳定匹配优化问题。
- ICML对抗式多臂老虎机的在线元学习
研究使用元学习算法解决敌对多臂赌博机问题,在每个 episode 中利用经验分布提高算法性能,并得到了针对该问题的最小遗憾界。
- Delaytron:利用延迟赌博反馈高效学习多分类器
介绍 Delaytron 和 Adaptive Delaytron 算法用于在线学习多类分类器,其中 Delaytron 使用常量步长并获得一定的遗憾保证,而 Adaptive Delaytron 使用加倍技巧并获得暂时性的遗憾保证。
- AAAI可重用资源的在线任务分配问题
本研究着眼于在线任务分配问题,利用可重复利用的资源来解决类似于拼车,众包和招聘等实际应用中的问题,提出了一个在线算法,并对其进行了数值实验。
- AAAI学习解释的赌博机
介绍了 Explearn,一种联合输出预测和解释预测的在线算法,它利用了基于 Gaussian Processes 的 contextual bandits。
- 随机序列模型下背包和 GAP 的改进在线算法
本研究中,我们研究了在随机顺序模型下,针对背包问题和广义分配问题的在线算法,提出了一种基于两个优化算法的新型算法,竞争比最高达到 1/6.65 和 1/6.99。
- 一种双重策略的动态图异常检测快速准确方法
本文提出了 AnomRank 算法,通过两个符合该算法的指标追踪每个节点的得分发现动态图中的突变重要性,实现了动态图的异常检测,其速度快、可扩展性强、理论上的这个方法是可行的,成功检测了两种常见的异常类型:边上的突变重量和图的突然结构变化。
- 连续正则化 Wasserstein 重心
通过引入随机算法,该研究提出了一种计算连续分布的 Wasserstein 重心的有效在线算法,该算法基于优化输运理论和 Wasserstein 重心,并使用其对偶势隐式地参数化了该问题。
- 具有无级收敛速率的随机多级组合优化算法
本研究提出了两种利用移动平均随机估计的梯度下降算法,用于解决多层级组合优化问题,并且修改后的算法在不需要小批量样本的前提下,大大提高了样本复杂度,最终达到了单层级设置的同样的样本复杂度。