用于排序治疗效果的元学习
本文提出了一种基于因果学习的新方法,通过引入决策因素建立机器学习和运营研究之间的桥梁来解决资源分配问题,并设计了一种定制化损失函数来对决策因素进行直接异质因果学习,从而显著提高了解决方案的精度。
Nov, 2022
稀缺资源分配政策的评估,采用随机对照试验数据,通过翻译和扩展最近的统计学思想提出了一种有效的估计方法和计算渐近正确置信区间的方法,验证其在实际环境中的方法学,提供先前不可见的结论。
Feb, 2024
通过降维回归模型,我们提出了一种数据驱动的方法,以多目标的最优政策学习为背景,从观测结果中学习出真实结果的低维度表示。我们的方法在政策评估和优化中降低了估计误差,通过降低噪音社会结果的方差,提高了算法分配的性能。
Apr, 2024
该研究提出了一种新的评估算法资源分配政策的实验方法,所使用的估计器可以通过重划分试验组参与者,构建对照试验并准确地评估结果。经过实证研究,该方法在合成数据、半合成数据和真实案例中都取得了改进的评估准确性。
Feb, 2023
本文提出了一种基于数据驱动、使用半黑盒模型和高效优化算法的营销预算配置框架,以应对在线业务中动态环境和复杂决策 - making 过程,支持多种业务约束,可以处理大规模的问题,并在阿里巴巴集团的许多场景中取得了成功的应用,离线实验和在线 A/B 测试均证明了其有效性。
Feb, 2019
本篇论文研究了众包标注中的预算分配问题,提出了一种基于贝叶斯马尔科夫决策过程的新算法,即乐观的知识梯度策略,该算法被证明在相同的预算水平下能够实现更高的标签准确性,实验结果表明了该算法在众包标注中的效果。
Mar, 2014
本研究论述了一些治疗效果评估的方法,探究了不同的元学习策略并以神经网络为基础,旨在构建更好的条件 / 环境下,使某些学习者的表现优于其他学习者的认识。
Jan, 2021
利用一个简单的数学模型,我们评估了基于预测的分配在具有更大单位(如医院、社区或学校)的设置中的有效性,发现当单位间的不平等性较低且干预预算较高时,基于预测的分配优于仅使用聚合单位级统计的基准方法。我们的结果适用于各种设置,包括预测成本、治疗效果的异质性和单位级统计的可学习性,共同突显了通过预测改进干预效果的潜在局限性。
Jun, 2024
本文研究了从记录的上下文、决策和结果中估计单个患者对替代药物的反应的个体层面因果效应的估计,并给出了基于不同治疗组之间的距离度量的误差的概括界限,引导了表示学习算法的开发,该算法通过规范化表示的诱导治疗组距离,鼓励治疗组之间信息的共享来最小化误差的界限。最后,对真实和合成数据的实验评估表明了所提出的表示架构和规范化方案的价值。
Jan, 2020
针对现代市场营销中的一个实际问题,我们提出了一种新的方法来解决策略优化问题,并构建了一种带约束的反事实策略优化模型。我们将奖励估计问题作为带有附加结构的域适应问题,并使用估计器进行带约束优化策略。我们证明了我们的估计程序具有理论误差界,并且我们在合成和真实数据集上证明了该方法明显改善。
Feb, 2019