Aug, 2023

突破组合极小化优化中的复杂性壁垒

TL;DR本文介绍了一种名为ADA-NSTORM的方法,利用自适应学习率来解决组合型最小极大优化问题,并且通过实验证明了其比NSTORM更有效。该方法在没有大批次要求的情况下,与最小极大优化的下限相匹配,显著推动了组合型最小极大优化的发展,这是保证分布鲁棒性和策略评估的关键能力。