Feb, 2018

从观测数据中学习最优策略

TL;DR本文通过控制实验方法和观察性数据建立了最优决策的理论模型,并利用域对抗神经网络的方法进行决策选择,从而在处理缺失反事实和选择偏差方面取得了较好的效果。