Jun, 2022

带有差分隐私的离线强化学习

TL;DR我们设计了差分隐私保证的离线强化学习算法,用于学习受个人隐私信息保护的数据驱动决策策略。理论证明和模拟实验表明,这些算法在中等规模数据集上不会牺牲过多效用。