- 在线装箱的简化学习增强算法与凹函数目标
通过使用机器学习预测以改善算法的性能,该研究论文介绍了一种针对在线装箱问题的简单的学习增强算法,并展示了该框架在线性规划、背包问题、资源管理效益、吞吐量最大化和网络效用最大化等多个领域的直接应用,同时提出了理解简单黑盒解决方案何时可优化的必 - 优化夏普比率:多臂赌博机中的风险调整决策
通过优化强化型夏普比率,我们提出了一种用于多臂赌博机的在线高斯过程算法,该算法克服了传统算法的缺陷,成功降低了风险投资组合管理问题的回报损失。
- 具有有限数据保留的在线算法
引入带有数据保留约束条件的在线算法模型,在多维均值估计和线性回归问题中展示了多维随机子集和对抗噪声模型在模拟随机梯度下降的进展方面的最新进展。
- AAAI通过激励兼容性在多对一匹配市场中改进的赌博算法
在这篇论文中,我们介绍了适应性的探索 - 延迟接受算法(AETDA)用于回应性设置,并得到了一个玩家最优稳定遗憾的 O (Nmin {N,K} ClogT/Δ²) 上界,同时证明了它的激励兼容性保证。我们还考虑了更广泛的可替代偏好,在此设置 - 多专家在线覆盖
设计在线算法,利用机器学习预测,以超越最坏情况范例,解决各种实际相关在线问题(如调度、缓存、聚类、滑雪租赁等)。通过研究设计具备多个专家的在线算法,以超越静态最佳专家的贪心基准。在新的动态基准中提出了具有 O(log K)性能保证的竞争算法 - 具有不确定性量化预测的在线算法
如何在设计在线算法中最佳利用不确定性量化预测,以及如何利用更一般形式的不确定性量化,提出了基于在线学习的框架来在多实例场景中学习如何充分利用不确定性量化作出最佳决策。
- 带有预算的重复二价拍卖中的协调动态竞标
本文研究了协同在线竞标算法在具有预算限制的重复次数第二价格拍卖中的效率,提出保证每个客户比独立竞标获得更高效用价值的算法,并以在线学习和均衡分析为技术支持,实现与多维基准的竞争。
- 一般的转换用于一致的在线近似算法
介绍了一种转换框架,可用于从离线近似算法中开发具有低阈值近似失配度的在线算法。
- 约束 k 次模最大化的在线和流式算法
本文提出了单遍流式和在线算法的受约束 k - 次模最大化,其中包含基数和背包约束限制,该算法可以提供不错的近似解和高效的解决方案,并在广告分配等应用实例上得到了验证。
- 流式异常检测
该论文提出了多种在线算法用于发现动态图和多方面数据流中的异常行为,并探讨了使用记忆模块的自动编码器来处理概念漂移的有效性。
- 在线异常检测器的元层分析
本文提供了对不同算法家族的主要在线探测器的质量、综合概述,包括构建、更新和测试探测模型的主要思想,并提供了在线检测算法与离线对应算法的结果定量实验评估的彻底分析,以及对数据集(即元特征)的各种特征进行统计分析。
- ICML在线主动回归
通过在线化算法实现积极回归问题的解决,利用较少的标签查询,实现收到的数据点的回归,提出新的算法解决问题。
- 在线算法的机器学习预测定制化
本研究探讨在机器学习算法中加入优化基准以提高在线算法的预测性能,以租赁或购买问题为例,并通过理论边界和数值模拟能够支持此发现。
- ICML多预测在线算法
本文研究了在多个机器学习预测的基础上增强的在线算法。我们提出了一个通用的算法框架,用于多重预测的在线覆盖问题,该算法能够获得与最佳预测器性能相竞争的在线解决方案。该算法还能够同时使竞争性达到最佳预测和最佳在线算法的性能水平,并应用于解决一些 - 在线图算法预测
本文研究具有预测的在线图形问题,提出了一个新的度量误差的定义 (metric error),并给出了一个通用框架,用于在线预测算法。采用这个框架,我们能够获得关于竞争比率的紧密限制,并将其作为度量误差的函数来描述。
- ICLR在线对抗攻击
本文将对深度学习模型的对抗攻击演化为数据流场景下的在线对抗攻击问题,提出了一个在线算法 Virtual + 并分析了算法竞争比例,在 MNIST 数据集上进行了实验。
- 在线多值学习:均值、矩和预测区间
提出了一种通用的有效技术,用于提供多值上下文预测,可以针对在线选择的对手样例 $(x,y)$ 在各种意义上提供 ' 多个有效性 ',其中结果估计正确地预测标签 y 的各种统计信息,甚至在线对抗情况下运用此算法也可以给黑盒算法的预测的不确定性 - 学习增广算法的原始 - 对偶方法
通过对原始双重算法的扩展,将预测信息加入在线算法中,并在多种特定领域采用新算法,与真实及预测的方案相比,当预测准确时优于任何在线算法,但同时可保持当预测误导时的良好保证。
- 学习增强在线算法的最优韧性 - 一致性平衡
研究如何将机器学习预测融入在线算法以提高性能,并提供非平凡的下界来衡量竞争分析的最优权衡.
- 带预测的加权页面在线算法
本文研究加权分页问题及其预测,提出 strong per request prediction (SPRP) 模型,证明结合固定的展望和下一个请求数的信息是不足以克服现有的下限。同时,我们还探讨了随着随着预测误差的增加,算法的缓慢衰退。通过