通过引入因果框架来研究策略适应问题,揭示了与游戏与改进相关的一些难点,提出了分类器设计与成本函数设计必须解决非平凡因果推断问题,而过往在策略分类方案的研究实际上是具有隐性因果模型的。
Oct, 2019
研究在在线回归模型中,个体会通过改变自己的特征来改进模型所预测的得分,并探讨在这一过程中,如何精准地找出对结果有意义的特征,并通过激励机制鼓励学习模型学习这些特征。
Feb, 2020
机器学习中的好斗现象及其解决方案的研究,通过将分类问题建模为一种游戏的方式,提出了一种近乎最优的、能够抵抗 “好斗” 现象的分类器设计算法,尤其对于一类自然代价函数而言,该算法在计算上也是高效的。
Jun, 2015
利用机器学习系统进行个体决策的智能行为研究,提出了基于 Stackelberg 博弈的模型,探讨了决策者对个体行为的预期能力对其目标函数和个体最佳反应的影响,并通过调整偏好,同时抑制操纵、鼓励改进和促进公平。
May, 2024
在战略分类中,学习者以一定的代价修改特征,以期从学习者的分类器中获得正面分类。我们考虑学习者在战略分类中部分信息披露的问题,研究代理在非完全了解分类器参数的情况下的最佳响应。我们展示了部分信息披露在增加代理操纵能力的同时,反直觉地有利于学习者的准确性,并提出了一些关于学习者优化问题的正面和负面结果,探讨了学习者应该披露多少信息来最大化预期准确性的算法问题。
Feb, 2024
研究在线线性分类问题,应对操纵特征的策略代理的对抗性选择和他们操纵向量的揭示偏好,提供一个计算有效的学习算法,获得减小的 Stackelberg 后悔以近似于最佳分类器。
Oct, 2017
本研究提出了一种新的稳健性估计器,以避免在透明决策规则下个体的行为可能造成的操纵行为对决策结果的影响并在肯尼亚的一项大型实验中表明,在策略鲁棒方法估计的决策规则的指导下,其表现优于基于标准监督学习方法的规则。
Apr, 2020
本文研究算法在分类和评估个体时受到个体激励影响的策略行为问题,并发现当任何现实的机制可以应对时,简单的线性机制就可以解决问题。
Jul, 2018
本研究提出了阈值设计师适配方法,通过人体实验评估发现,设计师更喜欢该方法,相比于现有的基准控制组,他们创造的内容更具高质量。
May, 2022
对比标准分类任务,战略分类涉及代理人在修改其特征以获得有利预测的过程中的策略性行为,重点关注战略分类与标准学习之间的可学习差距,并通过提供几乎紧密的样本复杂性和后悔界限来解释这一问题,同时引入两种自然的不确定性情况,以实现一定程度的放松的完全信息设置。