利用执行反馈的懊悔最小化

ICMLFeb, 2022

Regret Minimization with Performative Feedback

Meena Jagadeesan, Tijana Zrnic, Celestine Mendler-Dünner

TL;DR本文研究了在 performative 情境下找到接近最优点的模型的问题，该算法在找到最优解的同时还能保证低的后悔值，并通过对分布性的探索来构建风险置信度，从而建立了一种利用 bandits 算法来实现 performative 反馈下的后悔最小化的概念方法。

Abstract

In performative prediction, the deployment of a predictive model triggers a shift in the data distribution. As these shifts are typically unknown ahead of time, the learner needs to deploy a model to get feedback

performative prediction predictive model performativity regret bandit problem

发现论文，激发创造

利用赌率反馈的表现预测：通过重新参数化进行学习

本研究旨在研究不需要假设空间为凸集且模型对数据分布的映射事先已知的可应用的可执行预测问题。通过开发两级零阶优化算法，该算法一级旨在计算分布图，而另一个级别则将可执行预测目标重新参数化为由所引发的数据分布的函数。在一定的条件下，这种重新参数化使我们能够将非凸的目标转化为凸的目标，并实现可证明的遗憾保证。

May, 2023

无参数算法在决策相关分布下优化行为遗憾的研究

本文研究了行为风险最小化，这是一种在决策依赖分布下的随机优化方法。我们考虑了一般情况下的非凸型行为风险，在此基础上，我们提出了高效的无参数乐观优化方法。我们的算法在许多方面显著优于现有的利普希茨贝叶斯方法。特别是，我们的框架不需要关于分布映射的敏感性参数和损失函数的利普希茨常数的知识。这使得我们的框架在实践中更有优势，结合高效的基于乐观优化方法的树搜索机制。通过实验证据，我们展示了我们的算法在数值上优于现有方法和其他黑箱乐观优化方法。

Feb, 2024

基于不等式约束的零遗憾执行预测

对于受到不等式约束的可行预测问题，本文在鲁棒的原始对偶框架基础上提出了一种自适应的原始对偶算法，通过数值模拟验证了算法的有效性和理论结果，该算法在不等式约束下达到 O (√T) 的后悔与约束违规，使用了√T + 2T 个样本。

Sep, 2023

插件性能优化

本文研究了在目标性预测中使用可能被错误规定的模型的方法，通过使用名为 “插件表现优化” 的通用协议，证明了其过度风险的界限，结果表明，即使模型被错误规定，模型确实可以帮助学习实现表现。

May, 2023

神经网络的执行预测

该研究提出一种执行预测框架，关注于找到稳定的分类器来影响他们要预测的数据；并且可以放松关于损失函数的假设，通过使用 Lipschitz 连续的预测数据分布。通过实验，该研究表明可以使用这种方法学习关于真实数据的神经网络分类器。

Apr, 2023

有状态世界中的执行预测

本文提出了一个理论框架，建模了目标人群对已部署分类器的响应，同时研究了基于重复风险最小化和一种更懒惰的方法的两个重新训练算法的收敛性，能够更好的控制已部署分类器的影响，同时探讨了不同人群获取信息和资源的差异对已部署分类器的响应影响。

Nov, 2020

走出 “回音壁”：优化表现风险

本文探讨了 performative prediction 的问题，基于特定的损失函数和模型诱导的分布位移性质进行优化，从而实现风险凸优化，并且比通用导数优化方法具有更好的样本效率。

Feb, 2021

演绎预测的随机优化

本文研究了在执行预测中采用随机优化的问题，证明了在梯度下降中使用贪心和懒惰部署模型的收敛速度，并通过实验分析了两种方法的平衡点和最优情况。

Jun, 2020

数据如何与您的模型互动学习：执行梯度下降

该研究论文介绍了一种新的算法 PerfGD，通过捕捉模型对数据分布的影响来优化模型参数，为解决通过部署机器学习模型改变数据分布引起的性能问题提供了新的解决方案。

Feb, 2021

执行式预测

文章探讨了预测可能影响其预测目标的可执行性预测，并提出了一种风险最小化框架，引入了统计学、博弈论和因果性的概念，并给出了最小化损失的稳定点的必要和充分条件。在全面性上，表现性预测严格包含战略分类设置，并给出了克服战略反馈效应的重新培训的首个充分条件。

Feb, 2020