- 基于数据相关遗憾分析的在线核选择在记忆约束下的学习能力
在线核选择是在线核方法的基础问题之一。本文研究了在线核选择在内存约束下的问题,通过提供数据相关的上界,展示了在线可学习性、内存约束和数据复杂度之间的权衡关系。我们提出了一种算法框架,针对两类损失函数分别给出了数据相关的上界,并通过理论证明和 - 基于强对偶性的分布鲁棒约束强化学习
本研究通过基于强对偶性的算法框架,在环境不确定性的一个类别中提出了第一个高效且可证明的解决方法,来解决分布鲁棒受限强化学习(DRC-RL)问题,该问题旨在最大化预期奖励,同时受制于环境分布变化和约束条件。
- 迈向对称多人游戏的有原则的超越人类水平 AI
多人游戏的独特挑战在于均衡策略的非唯一性和代理人执行高度次优策略的风险。本文首次解决了多人对称标准形式游戏中的这些挑战,给出了 AI 代理人应该找到的正确解决方案以及能够证明解决该类游戏的通用算法框架。我们还证明了许多先前实用系统中开发的元 - 解耦学习与决策:用一阶方法突破在线资源分配中的 $O (√T)$ 障碍
在线线性规划在收入管理和资源分配中起着重要作用,本文提出了一种新的算法框架,将学习与决策分离,首次展示了基于一阶方法的在线算法可以达到 O (T^{1/3}) 的遗憾,同时进行了数值实验以验证理论发现。
- 因果协同并行强化学习
提出了一种用于数据共享和协调探索的新型算法框架,旨在在并发强化学习设置下学习更加数据高效和性能更好的策略,通过引入因果推断算法提取模型参数,并基于其相似度提出了一种新的数据共享方案,证明了在一组自回归、摆杆和倒立摆任务上具有更快学习速度,展 - 通过强化学习在动态系统中找到公平性的平衡点
在这篇论文中,我们研究了在顺序决策中存在着动态系统的公平性问题,提出了一个基于马尔可夫决策过程的算法框架,通过预处理和处理中方法集成各种公平性考虑,平衡传统公平性、长期公平性和效用。
- 基于均值嵌入的分布式贝尔曼算子
我们提出了一个新颖的算法框架来进行分布式强化学习,基于学习回报分布的有限维均值嵌入。我们基于此框架推导出了几个新的动态规划和时间差分学习算法,提供了渐近收敛理论,并对算法在一套表格任务上的实证性能进行了研究。此外,我们展示了这种方法可以与深 - 差分隐私中的实例特定异质敏感度
我们提供了一个新的算法框架,用于差分隐私估计一般函数,该框架根据底层数据集的难度进行动态调整。我们构建在先前的工作基础上,通过接近逆过程的数据集,即称为逆敏感性机制的指数机制选择一个输出的范例。我们的框架稍微修改了接近度度量,并提供了稀疏向 - 高效的样本有效的多智能体强化学习:优化视角
我们研究了多智能体强化学习 (MARL) 在一般和马尔可夫博弈 (MG) 下具有一般函数逼近的情况。通过引入一种新颖的复杂度度量,即多智能体解耦系数 (MADC),我们旨在找到基于样本高效学习的最小假设。利用该度量,我们提出了首个统一的算法 - 利用随机滤波和模式识别在反应扩散复杂网络中加强基于 POD 的模型简化技术
我们提出了一个算法框架,结合了模式识别和随机滤波理论的技术,以提高复杂网络模型在输入数据扰动情况下的输出准确性,并通过与神经常微分方程方法的基准测试进行了评估。
- 深度神经网络结构和超参数优化的算法框架
本篇论文提出一种基于演化有向无环图的算法框架,自动生成高效的深度神经网络并优化其相关超参数,与已有文献中的搜索空间相比更具灵活性,能优化网络的结构和超参数,已经在时间序列预测基准测试中得到了实验结果的验证。
- 通过概念漂移中的非稳态检测和适应实现在线联邦学习
本文提出一种多尺度算法框架,该框架结合了 FedAvg 和 FedOMD 算法在接近静态场景下的理论保证,同时采用非静态检测和自适应技术以改善 FL 泛化性能,并给出了多尺度算法框架,在具有广义凸损失函数的情况下,每 T 个回合导致动态后悔 - 在联邦学习中驯服 “重尾(具有潜在无限方差)” 的噪声
本文提出了一种名为 FAT-Clipping 的算法框架,它包含两个变量:FAT-Clipping per-round 和 FAT-Clipping per-iteration,可实现在强凸和一般非凸情况下的收敛,并且已被证明在 FL 系统 - 应用于市场预测的通用时间序列数据的因果分析
本文探究了基于时间延迟的因果分析和皮尔逊相关性在金融市场预测中的应用。作者提出了一种适用于金融市场的时间序列数据的实用方法,并使用不同类型的金融和社交媒体数据进行了实验测试。结果显示该方法可以判别不同实时市场数据之间的因果关系,同时讨论了目 - IJCAIKemeny 排名聚合的多样性:参数化方法
研究表明,通过将方案多样性与参数化复杂性理论相结合,可以使用基于算法的框架解决实际相关问题,例如 Kemeny Rank 聚合问题。
- 从统一视角探究双层优化在学习和视觉中的应用:调查与进展
本文介绍了如何使用 Bi-Level Optimization(BLO)来解决计算机视觉和机器学习领域的问题,建立了一个单层重构和统一算法框架,讨论了这个框架的潜力和未来的研究方向。
- 关系正则化的自动编码器学习
提出了一种新的算法框架用于学习数据分布的自编码器,该框架最小化模型与目标分布的差异,通过对可学习潜在先验的关系正则化,惩罚潜在先验与其对应后验之间的融合 Gromov-Wasserstein(FGW)距离,从而允许灵活地学习与生成模型相关的 - 超越 LIME 的替代预测解释
本文提出一种算法框架 bLIMEy,用于构建定制的本地替代解释器,其中包括 LIME,该框架独立且可互操作,并讨论了组件选择对结果解释器功能能力的影响。
- 弱凸弱凹极大极小问题的一阶收敛理论
本研究考虑了一类非凸非凹极值问题的一阶收敛理论和算法,它在机器学习中有广泛的应用,包括训练生成式对抗网络(GAN)。我们提出了一种算法框架,通过解决一系列强单调变分不等式,证明了所提出的方法的一阶收敛性和收敛率,并在 GAN 的训练中证明了 - 使用 p-filter 的带先验知识的多重检验的统一处理
本文介绍了一个统一的算法框架 p-filter,用于全局空假设检验和假阳性发现率控制,可以同时整合 (a)-(d) 四类先验知识,且包含多种已知算法特例。