协作机器学习中考虑奖励机制的模型奖励
通过差分隐私作为奖励,我们通过引入协作机器学习训练模型,对多个参与方的数据进行价值评估和奖励,并保护隐私风险。实证结果表明,我们的方法在合成和真实数据集上具有有效性和实用性。
Apr, 2024
本研究探讨合作机器学习市场的问题,讨论机器学习市场的公平收入分配和潜在威胁,包括数据复制。我们引入了一个新的付款分割功能和定制输出模型,以在具有不同学习任务的方的情况下刺激方提交高质量的训练和验证数据,并在实验中验证了我们理论分析的假设和这些假设的适用性。
Nov, 2019
本研究通过建立一个模型,并且研究了两个学习任务,即平均值估计和强凸目标的多轮 SGD,提出了一种可以激励诚实通信并确保学习质量的机制,以便对抗具有不诚实更新倾向的竞争者。我们最后在标准非凸联合学习基准测试上验证了我们机制的有效性,并证明了对于协作学习,明确建模不诚实客户的激励和行为可以提供强大的鲁棒性保证。
May, 2023
本篇论文主要探讨基于探索和开发的 incentivization 设计方法,处理在协作学习使用流数据时,公平性和资源分配不平衡问题。该方法确保节点仅根据其贡献程度获得奖励,并且采用渐进平等的机制,保持资源不足节点和资源充足节点的学习效果相等,其在两个真实数据场景中进行测试,证明该方法在公平性和学习表现等方面优于现有的对比基线方案。
Jun, 2023
提出了一种基于预测市场的众包学习机制方法,参与者可以通过赌注来修改推理任务的当前假设,并获得相应的盈利,以此改善预测的性能,从而解决了以往机器学习竞赛所存在的诸多弊端。
Nov, 2011
本文提出了一种使用神经网络模型来学习协作博弈解决方案,以促进公平合作分配的方法,特别是 Shapley value 在 Explainable AI 中的应用。
Aug, 2022
本研究综述了联邦学习的激励机制问题,归纳了不同的机制分类,包括 Stackelberg game, auction 和 reinforcement learning,并讨论将来的研究方向。
Jun, 2021
本文介绍了一种激励机制,鼓励客户共享他们所拥有的尽可能多的数据,以提高联合学习的性能,该机制与以前的不同之处在于使用模型性能而不是数据作为激励,我们在一定的条件下理论上证明了客户将使用他们尽可能多的数据参与联合学习
May, 2022