可复现学习的计算景观

May, 2024

On the Computational Landscape of Replicable Learning

Alkis Kalavasis, Amin Karbasi, Grigoris Velegkas, Felix Zhou

TL;DR我们研究算法可复现性的计算方面，这是由 Impagliazzo、Lei、Pitassi 和 Sorrell [2022] 引入的稳定性概念。通过一系列与可学习性的统计联系的最新研究，如在线学习、私有学习和 SQ 学习，我们旨在更好地理解可复现性与这些学习范式之间的计算联系。我们的第一个结果表明，存在一个概念类，其 PAC 学习可复现且高效，但在标准的密码学假设下，不存在这个类的高效在线学习者。随后，我们设计了一个高效的可复现学习算法，用于在边际分布与均匀分布之间差异很大的情况下 PAC 学习奇偶函数，进展了 Impagliazzo 等人 [2022] 提出的问题。为了获得这个结果，我们设计了一个可复现的提升框架，受 Blanc、Lange、Malik 和 Tan [2023] 的启发，以黑盒方式将均匀边际分布上的高效可复现 PAC 学习器转化为任意边际分布上的可复现 PAC 学习器，其样本和时间复杂度依赖于分布复杂度的某个度量。最后，我们证明任何纯 DP 学习器都可以在准确性、置信度参数的多项式时间内转化为一个可复现学习器，并且与底层假设类的表示维度成指数关系。

Abstract

We study computational aspects of algorithmic replicability, a notion of stability introduced by Impagliazzo, Lei, Pitassi, and Sorrell [2022]. Motivated by a recent line of work that established strong statistical connections between replicability and other notions of →

computational connections algorithmic replicability learnability pac learning replicable learner

发现论文，激发创造

学习中的可复制性和稳定性

本文研究了机器学习中的可复制性问题，提出了全局稳定性和列表可复制性的概念，并表明在除一些特殊情况外，大多数算法必须具有一定的随机性以实现可复制性。

Apr, 2023

可复制的强化学习

本篇文章探索了在机器学习中的可复制性问题，提出了一个可复制的算法架构和针对不同领域的可复制性解决方案，包括针对控制问题和批量学习设置的评估模型。

May, 2023

私有的 PAC 学习可能比在线学习更困难

根据合理的密码学假设，我们展示了一个概念类别，该类别允许在多项式时间内以多项式错误边界运行的在线学习器，但不存在计算效率高的差异隐私 PAC 学习器。

Feb, 2024

强化学习的可复制性

探讨强化学习领域中复制性的数学研究，提出了基于生成模型下的可复制性 RL 算法，其中包括一个有效的 $ ho$-replicable 算法和一个可计算的近似可复制的算法。

May, 2023

高维统计中的可复制性

研究了可复制性的计算和统计等价性以及高维统计任务中的样本复杂度，并提出了解决分布有有界协方差和 N-Coin 问题中的开放问题的有效算法。

Jun, 2024

局部 Borsuk-Ulam 定理，稳定性和可复现性

使用并改编拓扑学中的 Borsuk-Ulam 定理来推导对列表可复制和全局稳定学习算法的限制，在组合学和拓扑学中进一步展示了我们方法的适用性，并发现在无初始假设能力类设置下，列表可复制和全局稳定学习均不可能。

Nov, 2023

关于健壮性 PAC 学习的可计算性

对抗性强健学习的计算要求进行了研究，引入了鲁棒可计算的 CPAC 学习问题，并提供了一些简单的充分条件。同时，展示了该框架的一些令人惊讶的效果，即对于鲁棒 CPAC 可学习性而言，并不需要鲁棒损失是可计算的。引入了可计算鲁棒破碎维度这一新维度，证明了其有限性对于鲁棒 CPAC 学习性是必要的，但不充分。这对于鲁棒 PAC 学习性中相应现象的理解可能会带来新的见解。

Jun, 2024

可复制的学习大边界半空间

我们提供了学习大间隔半空间问题的高效可复制算法，改进了 Impagliazzo 等人提供的算法。我们首次设计了这个任务的无维度依赖的可复制算法，其在多项式时间内运行，是合适的，并且在所有相关参数方面与 Impagliazzo 等人取得的结果相比，样本复杂度有明显提高。此外，我们的第一个算法在精度参数 ε 上具有最优的样本复杂度。我们还设计了一种基于 SGD 的可复制算法，在某些参数区间内，比我们第一个算法具有更好的样本和时间复杂度。最后，我们设计了一种改进的算法，其在样本复杂度上优于我们以前的三种算法，并且运行时间呈指数关系于 1/τ^2。

Feb, 2024

可实现回归的最优学习方法：PAC 学习与在线学习

通过确定维度来对可实现回归进行统计复杂性及在线学习进行了全面分析，并提出了与学习能力相关的维度，从而在实践和理论上取得了显著的进展。

Jul, 2023

可复制学习中的清单和证书复杂度

本研究探讨了可复制的学习算法，在考虑可行的可复制性观念和证明可复制性的基础上，设计了一些用于特定学习问题的算法，其列表和证明的复杂度是最优的，并提出了相应的不可能性结果。

Apr, 2023