关键词personalized decision policies
搜索结果 - 3
- 具有异构观测数据的联邦离线策略学习
本文提出了一种基于聚合局部策略和双重稳健离线策略评估和学习策略的联邦策略学习算法,并针对异构数据源的观测数据情况,在不交换原始数据的情况下,在中央服务器上学习分布于异构数据源上的决策政策。
- 混淆鲁棒政策改进
研究使用观察数据学习个性化决策策略时如何考虑可能的未观测混杂因素以及最小化候选策略的最坏估计后悔的方法和算法,以在保证安全和关注证据改进的前提下得到可靠的个性化治疗策略。
- 平衡策略评估与学习
提出了一种基于平衡的权重方法来评估和学习个性化决策策略,该方法适用于利用历史记录来进行个性化医疗和互联网广告,该方法明显优于现有方法。