May, 2023

平衡风险和回报:自动分阶段发布策略

TL;DR这篇论文提出了通过一系列的 A/B 实验和自适应 Bayesian 方法来保证控制风险和最大化增长速度的策略,该方法被称为 batched bandit 问题,其中关键因素是实验预算。