- 短时、高容量的多臂 / 波段测试
现代平台利用随机实验从给定的项目集(“处理”)中进行明智决策。本研究探讨了一种贝叶斯多次播放自助游问题,涵盖了具有高容量短寿命项目的多元测试(或 “多个 A/B 测试”)问题的关键特点。通过大规模领域实验证明,我们的策略比平台当前的推荐系统 - 合并数据集收紧因果概率界限
对于在临床、流行病学和公共政策应用中存在的具有不同治疗方案的外部数据集,提供一种在这种具有挑战性的情景中提供概率因果边界的符号化方法,这些边界适用于任意协变量和治疗的维度,并讨论了这些边界在现有文献中更紧的条件。
- 选择过去实验中的代理指标
在大量随机实验中,通过生成决策指南,我们引入了一种新的统计框架来定义并构建适用于同质人群的最佳代理度量标准,该度量标准能够与长期度量密切跟踪,并在噪声较高的情况下进行优化问题的解决。通过运用这种方法,我们在一个工业推荐系统的大量随机实验中应 - 估值基于证据的决策
本文提出一个实证框架,用于估计基于证据的决策(EBDM)的价值和统计精度投资的回报。
- 异质人群下的早停法
本文研究了如何通过因果机器学习方法,为具有异质种人群的实验寻求提前停止,提出了一种广泛适用的停止实验的方法 CLASH,并证明其在模拟和真实数据上都具有有效的性能。
- MM通过基于观察数据的模拟和延迟奖励进行销售渠道优化:LinkedIn 案例研究
本文针对 LinkedIn 的销售渠道选择优化问题,通过离散时间仿真实验发现,在考虑资源分配随机性时,相对于基于规则或监督学习的策略,基于多臂老虎机算法的策略(LinUCB)能够实现互联网广告的有效增量提升。
- ICML激励遵守算法工具
本文研究了随机实验可能因参与者的潜在非合规性而容易受到选择偏差的影响,并提出了一个博弈论模型来研究动态行为对合规性的影响,该模型可估计每种治疗的治疗效应并将规划者的建议视为工具变量。
- 具有噪声实验的约束贝叶斯优化
本文提出一种基于贝叶斯优化的方法用于有噪声的随机实验,通过利用贪心批量优化和拟蒙特卡罗逼近,有效地优化了多个连续参数,并在 Facebook 进行的真实实验中验证了其性能。
- 多个处理和一般响应类型的提升建模
本文提出了一种新型的 uplift 算法,通过随机森林进行建模,利用一种新颖的评估方法可以获取 uplift 模型中最重要的性能度量值 - 预期响应,解决了数据无法测量个体对不同治疗方式响应的问题,在合成数据和行业提供的数据上的实验结果表明 - 随机实验中的高维回归调整
本文提出了一种用于高维协变量信息下随机实验治疗效果估计的风险一致回归调整的方法,并建议使用交叉估计方法来获得有限样本无偏的治疗效果估计,最后对自适应规范搜索和机器学习方法如随机森林或神经网络等进行了拓展分析。
- 网络实验的设计与分析:降低干扰误差
评估减少网络干扰的随机实验设计和分析方法,通过仿真实验证明这些方法能够在各种网络结构和社会行为中显著地减少偏差和误差,特别是对于网络中存在更多聚类的情况和数据生成过程中存在更强的治疗直接效应和单位之间更强的相互作用的情况。
- 随机方案评估中治疗效果异质性的估计
本文研究对社会项目和医疗方案的疗效进行随机实验评估时,如何准确评估其异质性治疗效应,进而为大量可用的治疗方案选择最有效的方案,确定治疗成功或失败的人群,以及设计个性化的最佳治疗方案。本文提出一种利用支持向量机分类器适应变量选择问题进行异质性 - 识别 N 个变量间所有因果关系的实验数在最坏情况下的充分必要性
利用随机化实验,可在没有潜在变量、样本选择偏差和反馈循环的情况下,确定 N 个变量之间的因果关系,最多需要 log2 (N) + 1 次实验,而当每个实验同时随机化 K 个变量时,我们提供了实验数量的上界,并且发现这个上界比每次随机化最多一 - 以设计为先,实现客观因果推断
观察性研究常常存在客观性问题,本文讨论了如何通过仔细设计的方案来近似随机化实验,以获得更准确的因果推断。涉及的问题包括关键协变量数据缺失、治疗和对照组关键协变量分布的重叠度分析等,同时提出了可能的解决方案并分析了潜在结果的定义和因果效应的关