Feb, 2019

通过结构对照推断实现费用效益的激励分配

TL;DR针对现代市场营销中的一个实际问题,我们提出了一种新的方法来解决策略优化问题,并构建了一种带约束的反事实策略优化模型。我们将奖励估计问题作为带有附加结构的域适应问题,并使用估计器进行带约束优化策略。我们证明了我们的估计程序具有理论误差界,并且我们在合成和真实数据集上证明了该方法明显改善。