Oct, 2023

具有偏差和方差减少的分布鲁棒优化

TL;DR使用分布稳健优化(DRO)问题中的谱风险不确定性集和 $f$- 散度惩罚,我们构建了一个包括常见风险敏感学习目标的模型。我们提出了 Prospect 算法,只需要调整一个学习率超参数,证明其对于平滑正则化损失具有线性收敛性。与先前的算法相比,前者要求调整多个超参数或由于有偏梯度估计或不充分的正则化而可能无法收敛。在实证上,我们展示了在跨表格、视觉和语言领域的分布偏移和公平性基准上,Prospect 算法的收敛速度可以比随机梯度和随机鞍点方法快 2-3 倍。