在线自动机器学习的 ChaCha 算法
可持续觅食问题是一个多智能体环境试验平台,探索智能体处理社会困境中的认知形式,需要通过觅食抵制个体奖励的诱惑并选择集体的长期可持续目标。我们研究了神经进化和深度递归 Q 网络在线学习的方法,使智能体可以像所需的恶性社会问题一样尝试解决问题。我们进一步探讨了利用长短期记忆学习时间依赖性是否能够帮助智能体开发长期的可持续觅食策略。研究发现,长短期记忆的整合帮助智能体开发了单个智能体的可持续策略,但未能帮助智能体处理多智能体场景中出现的社会困境。
Jul, 2024
通过引入一种在线、元梯度算法,我们改善了规划过程的效率,进而提高了整体学习过程的样本效率。我们的方法避免了传统规划方法的几种病态现象,并有望在未来的研究中为大规模模型驱动的强化学习系统的设计提供有用的参考。
Jun, 2024
在边缘人工智能应用中,使用脉冲神经网络(SNNs)进行设备上的在线学习和自适应,以实现对不断变化的环境中产生的传感器数据的快速处理。我们提出了一种脉冲神经网络的脑启发式处理器 EON-1,用于在近传感器极端边缘在线特征提取,该处理器集成了快速的在线学习和自适应算法。我们报告了仅 1% 的学习能耗开销,远低于其他 SoTA 解决方案,同时达到相当的推理准确度。此外,我们证明了 EON-1 可以在实时处理高清和超高清流媒体视频时实现低延迟,同时进行学习。
Jun, 2024
本研究提出了一种新颖的基于图像引导的室外点云质量评估算法(IGO-PQA),该算法利用点云数据、对应的 RGB 环境图像和车辆目标真值注释生成基于单帧 LiDAR 点云的整体质量得分,并通过变换器实现无参考室外点云质量评估的直接预测。评估结果表明,IGO-PQA 生成算法提供了一致且合理的感知质量指标,而 IGO-PQA 回归算法在 nuScenes 数据集上达到了 0.86 的皮尔逊线性相关系数,并在 Waymo 数据集上达到了 0.97。
Jun, 2024
通过可观察的产品特征和顾客特征,提出一种新算法,通过离散化未知噪声分布和上限置信区间与分层数据分区技术的组合,有效地调节每个周期中的懊悔,从而控制与定价决策相关的懊悔,实现极小极大优化。
Jun, 2024
我们提出了一个控制论强化学习方法,用于直接学习最优策略,并在这个方法的一个特定实例基础上建立了理论性质,并导出了一个算法。我们的实证结果证明了我们方法的显著优势。
Jun, 2024
我们介绍和分析了一种通用的在线算法,适用于二元、多类和多标签分类问题中的各种复杂性能指标,该算法的更新和预测规则简单且计算效率高,无需存储任何过去的数据,而且对于凹函数和平滑度函数达到了 O (ln n/n) 的遗憾,并通过实证研究验证了所提算法的效率。
Jun, 2024
通过引入第一个实际有效的算法来计算扩展者分解及其层级,我们在大量的实验中展示了我们基于扩展者的算法在解决归一化割图聚类问题上相对于当前最先进的解决方案在解决质量上大大优于各种图类,如引用、电子邮件、社交网络或网络图,并且在运行时间上仍然具有竞争力。
Jun, 2024
通过在线学习框架将原模型重新设计为一种动态策略,以在统计假设下不受限制地接近真实总结的组合的经验效用、夏普比率和增长率。
Jun, 2024