基于分布学习的博弈论解决方案框架
探索了在合作博弈中的 PAC(可能近似正确)学习模型,研究了几种合作博弈的 PAC 可学习性以及 PAC 可学习性与核稳定之间的联系,如网络流游戏,阈值任务游戏和诱导子图游戏。通过多项式样本数,可以找到可能稳定的收益分配。
Apr, 2015
本文开发了一种理论,可以在广义第二价格拍卖中从观察到的数据中推断出玩家估值,而不需要依赖于纳什均衡的假设,并展示了如何在一些 no-regret learning 算法的假设下推断玩家的价值,这对于在拍卖数据上测试任何学习理论行为模型前的重要步骤。
May, 2015
本文提出一种基于 PAC 学习框架的约束学习方法,该方法通过对经验风险最小化规则进行约束来解决分类问题中的偏差、不公平和不稳定性等问题,研究表明该方法能够实现约束学习的泛化。
Jun, 2020
探究 Hedonic Games 的 PAC 可学习性和 PAC 稳定性,并提供不同类别的学习 / 稳定性结果,特别是在全表达形式下的 Hedonic Coalition Nets 表述中,我们识别了两组条件并针对特定 Hedonic Games 类别阐明了推动学习 / 稳定性的结构属性。
Jan, 2023
我们介绍了一个新的框架,使用 PAC-Bayesian 理论来研究元学习方法。该框架相比以往的工作的主要优势在于它允许在任务之间的知识转移方面更加灵活。我们的框架的灵活性使其适用于分析广泛范围的元学习机制,甚至设计新的机制。除了理论贡献外,我们还通过经验证明我们的框架提高了实际元学习机制的预测质量。
Feb, 2024
用 PAC-Bayesian 理论为学习优化问题提供了第一个具备可证估计以及收敛保证和收敛速度权衡的框架,学习出的优化算法在比起仅从最坏情况分析得出的算法上具备可证的优越性能,基于指数族的 PAC-Bayesian 上界对一般的、可能无界的损失函数提供了可行性,我们通过将学习过程转化为一维最小化问题并研究全局最小值的可能性,提供了一个具体算法实现和学习优化的新方法,并进行了四个实际相关的实验来支持我们的理论,展示出该学习框架使得优化算法的性能有了数个数量级的改进。
Apr, 2024
讨论分布式数据的 PAC 学习问题,分析了涉及的基本通信复杂性问题,包括教学维度和错误绑定。针对特定概念类别,如合取、奇偶函数和决策列表等,给出上下界限。讨论了如何通过增强来在分布式环境下进行一般性通信,以及如何在不确定环境下实现低通信回归。同时,还考虑了隐私性,包括差分隐私和分布式隐私。
Apr, 2012
该研究旨在建立一个框架,以引导一群简单、专业、自我利益代理人解决传统上作为整体单一代理人序列决策问题的难题,并通过设计一种学习环境机制,使每个代理人的最优解与 Nash 平衡策略一致,并为其推导出了一类分散式强化学习算法,同时展示了该社群内在结构对于更高效的迁移学习可能带来的潜在优势。
Jul, 2020
本文提出了一种将博弈论与偏好学习相结合的新算法,可解决大规模特征选取和模型可解释性等问题,并在分类任务中实现了最先进的精度。
Dec, 2018
研究网络动力系统在多层网络上的可学习性,并提出了基于 PAC 学习算法的有效算法及对 Natarajan 维度的严格分析,为多层动力系统的学习问题提供了理论基础。
May, 2024