市场资源分配问题的直接异质因果学习
发展援助的因果机器学习框架可用于预测不同援助金额的异质性治疗效果,从而在全球实现可持续发展目标,尤其是对于传染病如 HIV / AIDS 的援助分配有重要作用。
Jan, 2024
通过将多任务学习应用于机器学习算法中,结合 Elastic Weight Consolidation 和 Gradient Episodic Memory 的方法,并与增强训练数据分布的现有技术进行比较,本研究证明多任务方法对处理医疗领域等特殊需求的稀有重大事件有很高的效果。
Apr, 2023
本文提出了一种基于数据驱动、使用半黑盒模型和高效优化算法的营销预算配置框架,以应对在线业务中动态环境和复杂决策 - making 过程,支持多种业务约束,可以处理大规模的问题,并在阿里巴巴集团的许多场景中取得了成功的应用,离线实验和在线 A/B 测试均证明了其有效性。
Feb, 2019
该研究提出一种利用机器学习建议进行在线资源分配决策的框架,算法类似于一种 Pareto 最优算法,它能够在机器学习建议存在不准确性的情况下,在保证一定的性能准则的前提下尽量提高稳健比率,最终证明与基准算法相比,该算法能够在最坏和平均情况之间实现平衡,并且获得更好的性能。
Jun, 2023
给定未知质量的预测作为输入,我们提出了一种算法,在未知预测质量和请求模型的情况下,在在线资源分配问题中实现了渐进最优表现,验证了算法的性能与任何已知到达模型和预测准确性的算法的最佳性能相匹配。
Feb, 2024
政府在制定和执行政策时,灵活生成异质治疗效应估计的因果机器学习方法可能是非常有用的工具。本文认为,标准的 AI 公平性方法并不适用于所有因果机器学习应用,因为因果机器学习通常使用建模来为最终的决策者提供信息,而 AI 公平性方法则假设模型直接做出决策。我们将这些情境分别定义为间接和直接决策,认为政策制定最好视为一项联合决策,其中因果机器学习模型通常只具有间接权力。我们提出了此情境下的公平性定义,即一个模型能为决策者提供准确做出关于公正政策结果的价值判断所需的信息,并指出因果机器学习模型的复杂性可能使其难以实现。解决方法不是传统的 AI 公平性调整,而是谨慎的建模和意识到这些方法可能鼓励的一些决策偏差。
Sep, 2023
本文针对大型企业流程中的资源分配问题,提出了两种基于深度强化学习和基于分数的价值函数逼近方法,实验结果表明这两种学习方法在多数情况下优于传统启发式算法解决资源分配问题。
Apr, 2023
我们探索了一种用于动态公平资源分配问题的主动学习方法,该方法假设在在线资源分配过程的每个时期,仅从选择的代理人子集中获取反馈。尽管存在这种限制,我们提出的算法在包括资源分配问题中常用的公平度量和匹配机制中的稳定性考虑等各种度量中,提供了与时间周期数次线性相关的后悔界限。我们算法的关键洞察在于通过利用对决性的上限和下限置信区间来自适应地识别最具信息量的反馈。通过这种策略,我们证明高效的决策不需要大量的反馈,并为各种问题类别产生高效的结果。
Jun, 2024