Feb, 2024

优化自适应实验:遗憾最小化和最佳臂识别的统一方法

TL;DR本文提出了一个统一的模型,同时考虑了实验内表现和实验后结果,为大规模人群中的最佳表现提供了一个清晰的理论,并揭示了一些新的洞见。