在线自动机器学习的 ChaCha 算法

ICMLJun, 2021

ChaCha for Online AutoML

Qingyun Wu, Chi Wang, John Langford, Paul Mineiro, Marco Rossi

TL;DR本文提出了一种名为 ChaCha 的算法，用于在线学习环境下进行超参数的选择和优化，ChaCha 利用样本复杂度限制确定冠军并调度一组实时的挑战者，经过应用程序相关的冠军的 oracle 确认最佳的配置后保证具有亚线性遗憾。在实验中，我们表明 ChaCha 在各种数据集上优化特征选取和超参数决策时性能良好。

Abstract

We propose the chacha (Champion-Challengers) algorithm for making an online choice of hyperparameters in online learning settings.

chacha algorithm online learning hyperparameter featurization

发现论文，激发创造

可持续觅食问题的在线学习时间依赖性

可持续觅食问题是一个多智能体环境试验平台，探索智能体处理社会困境中的认知形式，需要通过觅食抵制个体奖励的诱惑并选择集体的长期可持续目标。我们研究了神经进化和深度递归 Q 网络在线学习的方法，使智能体可以像所需的恶性社会问题一样尝试解决问题。我们进一步探讨了利用长短期记忆学习时间依赖性是否能够帮助智能体开发长期的可持续觅食策略。研究发现，长短期记忆的整合帮助智能体开发了单个智能体的可持续策略，但未能帮助智能体处理多智能体场景中出现的社会困境。

Jul, 2024

元梯度搜索控制：提高 Dyna 风格规划效率的方法

通过引入一种在线、元梯度算法，我们改善了规划过程的效率，进而提高了整体学习过程的样本效率。我们的方法避免了传统规划方法的几种病态现象，并有望在未来的研究中为大规模模型驱动的强化学习系统的设计提供有用的参考。

Jun, 2024

EON-1：一种用于近传感器极端边缘在线特征提取的脑启发处理器

在边缘人工智能应用中，使用脉冲神经网络（SNNs）进行设备上的在线学习和自适应，以实现对不断变化的环境中产生的传感器数据的快速处理。我们提出了一种脉冲神经网络的脑启发式处理器 EON-1，用于在近传感器极端边缘在线特征提取，该处理器集成了快速的在线学习和自适应算法。我们报告了仅 1% 的学习能耗开销，远低于其他 SoTA 解决方案，同时达到相当的推理准确度。此外，我们证明了 EON-1 可以在实时处理高清和超高清流媒体视频时实现低延迟，同时进行学习。

Jun, 2024

自主驾驶的户外激光雷达感知质量评估指导影像

本研究提出了一种新颖的基于图像引导的室外点云质量评估算法（IGO-PQA），该算法利用点云数据、对应的 RGB 环境图像和车辆目标真值注释生成基于单帧 LiDAR 点云的整体质量得分，并通过变换器实现无参考室外点云质量评估的直接预测。评估结果表明，IGO-PQA 生成算法提供了一致且合理的感知质量指标，而 IGO-PQA 回归算法在 nuScenes 数据集上达到了 0.86 的皮尔逊线性相关系数，并在 Waymo 数据集上达到了 0.97。

Jun, 2024

上下文动态定价与综合估值模型中的极小化最优性

通过可观察的产品特征和顾客特征，提出一种新算法，通过离散化未知噪声分布和上限置信区间与分层数据分区技术的组合，有效地调节每个周期中的懊悔，从而控制与定价决策相关的懊悔，实现极小极大优化。

Jun, 2024

强化学习的广义控制论方法：理论与算法

我们提出了一个控制论强化学习方法，用于直接学习最优策略，并在这个方法的一个特定实例基础上建立了理论性质，并导出了一个算法。我们的实证结果证明了我们方法的显著优势。

Jun, 2024

优化复杂绩效指标的通用在线算法

我们介绍和分析了一种通用的在线算法，适用于二元、多类和多标签分类问题中的各种复杂性能指标，该算法的更新和预测规则简单且计算效率高，无需存储任何过去的数据，而且对于凹函数和平滑度函数达到了 O (ln n/n) 的遗憾，并通过实证研究验证了所提算法的效率。

Jun, 2024

学习覆盖：在线学习和优化与不可逆决策

通过限制在线学习和优化策略的探索次数，将不确定性减少为最低程度，从而最小化成本并实现覆盖目标。

Jun, 2024

图上标准切割的扩展层次结构

通过引入第一个实际有效的算法来计算扩展者分解及其层级，我们在大量的实验中展示了我们基于扩展者的算法在解决归一化割图聚类问题上相对于当前最先进的解决方案在解决质量上大大优于各种图类，如引用、电子邮件、社交网络或网络图，并且在运行时间上仍然具有竞争力。

Jun, 2024

未知分布的长期投资中的均值方差组合选择：在线估计，不确定性下的风险厌恶与算法的普适性

通过在线学习框架将原模型重新设计为一种动态策略，以在统计假设下不受限制地接近真实总结的组合的经验效用、夏普比率和增长率。

Jun, 2024