基于动态控制匹配的大规模自适应测试验证

May, 2023

基于动态控制匹配的大规模自适应测试验证

Validation of massively-parallel adaptive testing using dynamic control matching

Schaun Wheeler

TL;DR本文提出了一种在动态同时运行多个测试并持续适应的条件下，使用匹配的合成控制组来分离各种测试因果效应的方法，以应对现代企业对 A/B 测试的需要。

Abstract

a/b testing is a widely-used paradigm within marketing optimization because it promises identification of causal effects and because it is implemented out of the box in most messaging delivery software platforms.

a/b testing causal effects parallel testing reinforcement learning matched-synthetic control group

发现论文，激发创造

快速可扩展的贝叶斯 AB 测试

通过使用分层贝叶斯估计方法，我们提出一种解决 AB 测试分析中常见限制的解决方案，包括多因素和因素之间的相关性、早期停止的顺序测试和从过去测试中提取综合全球学习的能力。通过数值模拟和大量实际 AB 测试，我们证明了这种方法的实际价值。

Jul, 2023

在线机器学习实验中的常见误解

本文讨论了机器学习模型在线实验所面临的问题，指出常用的 A/B-tests 并不能保证无偏估计。因此，文章提出了对从事此领域的从业人员和研究人员的影响及解决方案。

Apr, 2023

在线 FDR 控制下 Multi-A/B 测试框架

提出了一种用最佳臂多臂老虎机 (MAB) 的连续监控替代 A/B 测试的新框架，利用在线虚警率控制算法和顺序 p 值，同时实现了样本优化、强大的能力和低虚假发现率 (FDR)。

Jun, 2017

自适应实验设计与反事实推断

本文讨论了使用自适应实验设计方法在非稳态的工业环境下进行实验的挑战和陷阱，提供了在这些环境中的正确目标和系统规格的不同观点，并基于这些经验开发了一个自适应实验设计框架用于对照推断，并在商业环境中进行了测试。

Oct, 2022

在线 A/B 测试中未来用户活动的改进预测

在线随机实验和 A/B 测试中，参与者包含率的准确预测是至关重要的，本文提出了一种新颖、直接且可扩展的贝叶斯非参数方法，用于预测在线 A/B 测试中个体接受干预的比率，并展示了其在实验和模拟数据上相对于现有方法的卓越性能。

Feb, 2024

三元之优：实践中的数字营销适应性实验

基于经验开发了一种适应性实验设计（AED）框架，用于反事实推断，并在商业环境中进行了测试，以解决在具有非平稳性的工业环境中使用 AED 系统的挑战和问题。

Feb, 2024

通过贝叶斯赌博算法在线评估定向广告受众

该论文介绍了一种在分割目标受众群体并在线实验中解决数字广告匹配问题的上下文强化学习算法，并在中国电商平台 JD.com 上实现

Jul, 2019

A/B 测试的复杂性

该研究提供了一种改进的 A/B 测试性能的分布依赖性下限方法，特别是在高斯分布和伯努利分布下，为固定置信度和固定预算的情况下提供了复杂性的证明和比较，同时还提供了停止规则。

May, 2014

一种两部分的机器学习方法用于表征 A/B 测试中的网络干扰

提出了一种基于机器学习的方法来识别和表征异质网络干扰，该方法通过引入因果网络模式和透明机器学习模型来建立反映潜在网络干扰模式的最适 exposure mapping，为管理网络干扰和提高 A/B 测试精确性提供了全面的自动化解决方案。

Aug, 2023

贝叶斯测试中的可选停止：无痛 A/B 测试的连续监测

本文证明了在使用适当停止规则的情况下，贝叶斯检验与连续监控的有效性，并通过具体模拟实例说明了理论结果。文章指出了常见的不良实践，比较了该方法与 NHST 校正，并提供了研究人员和实践者的一般指导方针。

Feb, 2016