May, 2023

合作学习和优化中激励竞争者诚实行为的研究

TL;DR本研究通过建立一个模型,并且研究了两个学习任务,即平均值估计和强凸目标的多轮 SGD,提出了一种可以激励诚实通信并确保学习质量的机制,以便对抗具有不诚实更新倾向的竞争者。我们最后在标准非凸联合学习基准测试上验证了我们机制的有效性,并证明了对于协作学习,明确建模不诚实客户的激励和行为可以提供强大的鲁棒性保证。