通过使用分层贝叶斯估计方法,我们提出一种解决 AB 测试分析中常见限制的解决方案,包括多因素和因素之间的相关性、早期停止的顺序测试和从过去测试中提取综合全球学习的能力。通过数值模拟和大量实际 AB 测试,我们证明了这种方法的实际价值。
Jul, 2023
本文讨论了机器学习模型在线实验所面临的问题,指出常用的 A/B-tests 并不能保证无偏估计。因此,文章提出了对从事此领域的从业人员和研究人员的影响及解决方案。
Apr, 2023
提出了一种用最佳臂多臂老虎机 (MAB) 的连续监控替代 A/B 测试的新框架,利用在线虚警率控制算法和顺序 p 值,同时实现了样本优化、强大的能力和低虚假发现率 (FDR)。
Jun, 2017
本文讨论了使用自适应实验设计方法在非稳态的工业环境下进行实验的挑战和陷阱,提供了在这些环境中的正确目标和系统规格的不同观点,并基于这些经验开发了一个自适应实验设计框架用于对照推断,并在商业环境中进行了测试。
Oct, 2022
在线随机实验和 A/B 测试中,参与者包含率的准确预测是至关重要的,本文提出了一种新颖、直接且可扩展的贝叶斯非参数方法,用于预测在线 A/B 测试中个体接受干预的比率,并展示了其在实验和模拟数据上相对于现有方法的卓越性能。
Feb, 2024
基于经验开发了一种适应性实验设计(AED)框架,用于反事实推断,并在商业环境中进行了测试,以解决在具有非平稳性的工业环境中使用 AED 系统的挑战和问题。
该论文介绍了一种在分割目标受众群体并在线实验中解决数字广告匹配问题的上下文强化学习算法,并在中国电商平台 JD.com 上实现
Jul, 2019
该研究提供了一种改进的 A/B 测试性能的分布依赖性下限方法,特别是在高斯分布和伯努利分布下,为固定置信度和固定预算的情况下提供了复杂性的证明和比较,同时还提供了停止规则。
May, 2014
提出了一种基于机器学习的方法来识别和表征异质网络干扰,该方法通过引入因果网络模式和透明机器学习模型来建立反映潜在网络干扰模式的最适 exposure mapping,为管理网络干扰和提高 A/B 测试精确性提供了全面的自动化解决方案。
Aug, 2023
本文证明了在使用适当停止规则的情况下,贝叶斯检验与连续监控的有效性,并通过具体模拟实例说明了理论结果。文章指出了常见的不良实践,比较了该方法与 NHST 校正,并提供了研究人员和实践者的一般指导方针。
Feb, 2016