市场资源分配问题的直接异质因果学习

AAAINov, 2022

市场资源分配问题的直接异质因果学习

Direct Heterogeneous Causal Learning for Resource Allocation Problems in Marketing

Hao Zhou, Shaoming Li, Guibin Jiang, Jiaqi Zheng, Dong Wang

TL;DR本文提出了一种基于因果学习的新方法，通过引入决策因素建立机器学习和运营研究之间的桥梁来解决资源分配问题，并设计了一种定制化损失函数来对决策因素进行直接异质因果学习，从而显著提高了解决方案的精度。

Abstract

marketing is an important mechanism to increase user engagement and improve platform revenue, and heterogeneous causal learning can help develop more effective strategies. Most decision-making problems in

marketing causal learning resource allocation machine learning decision factor

发现论文，激发创造

用于排序治疗效果的元学习

通过学习排名的方法，我们提出了一种在预算约束下有效分配治疗的方法，并验证了其在合成和真实数据上的有效性。

May, 2024

发展援助的成本效益分配的因果机器学习

发展援助的因果机器学习框架可用于预测不同援助金额的异质性治疗效果，从而在全球实现可持续发展目标，尤其是对于传染病如 HIV / AIDS 的援助分配有重要作用。

Jan, 2024

一种多任务方法的鲁棒深度强化学习用于资源分配

通过将多任务学习应用于机器学习算法中，结合 Elastic Weight Consolidation 和 Gradient Episodic Memory 的方法，并与增强训练数据分布的现有技术进行比较，本研究证明多任务方法对处理医疗领域等特殊需求的稀有重大事件有很高的效果。

Apr, 2023

营销预算分配的统一框架

本文提出了一种基于数据驱动、使用半黑盒模型和高效优化算法的营销预算配置框架，以应对在线业务中动态环境和复杂决策 - making 过程，支持多种业务约束，可以处理大规模的问题，并在阿里巴巴集团的许多场景中取得了成功的应用，离线实验和在线 A/B 测试均证明了其有效性。

Feb, 2019

凸集机器学习建议的在线资源分配

该研究提出一种利用机器学习建议进行在线资源分配决策的框架，算法类似于一种 Pareto 最优算法，它能够在机器学习建议存在不准确性的情况下，在保证一定的性能准则的前提下尽量提高稳健比率，最终证明与基准算法相比，该算法能够在最坏和平均情况之间实现平衡，并且获得更好的性能。

Jun, 2023

两个世界中的最佳选择：在未知到达模型下的在线资源分配与预测

给定未知质量的预测作为输入，我们提出了一种算法，在未知预测质量和请求模型的情况下，在在线资源分配问题中实现了渐进最优表现，验证了算法的性能与任何已知到达模型和预测准确性的算法的最佳性能相匹配。

Feb, 2024

迭代因果分割：填补市场分割和营销策略之间的空白

我们介绍了我们的形式上证明的算法，迭代因果分割，以解决在紧密耦合系统中处理因果治疗变量和混杂协变量的问题。

May, 2024

机器学习方法在政策制定中异质治疗效果估计的公平性问题

政府在制定和执行政策时，灵活生成异质治疗效应估计的因果机器学习方法可能是非常有用的工具。本文认为，标准的 AI 公平性方法并不适用于所有因果机器学习应用，因为因果机器学习通常使用建模来为最终的决策者提供信息，而 AI 公平性方法则假设模型直接做出决策。我们将这些情境分别定义为间接和直接决策，认为政策制定最好视为一项联合决策，其中因果机器学习模型通常只具有间接权力。我们提出了此情境下的公平性定义，即一个模型能为决策者提供准确做出关于公正政策结果的价值判断所需的信息，并指出因果机器学习模型的复杂性可能使其难以实现。解决方法不是传统的 AI 公平性调整，而是谨慎的建模和意识到这些方法可能鼓励的一些决策偏差。

Sep, 2023

学习在业务流程中的资源分配策略

本文针对大型企业流程中的资源分配问题，提出了两种基于深度强化学习和基于分数的价值函数逼近方法，实验结果表明这两种学习方法在多数情况下优于传统启发式算法解决资源分配问题。

Apr, 2023

公平稳定的在线分配的主动学习

我们探索了一种用于动态公平资源分配问题的主动学习方法，该方法假设在在线资源分配过程的每个时期，仅从选择的代理人子集中获取反馈。尽管存在这种限制，我们提出的算法在包括资源分配问题中常用的公平度量和匹配机制中的稳定性考虑等各种度量中，提供了与时间周期数次线性相关的后悔界限。我们算法的关键洞察在于通过利用对决性的上限和下限置信区间来自适应地识别最具信息量的反馈。通过这种策略，我们证明高效的决策不需要大量的反馈，并为各种问题类别产生高效的结果。

Jun, 2024