关键词inverse propensity weighting
搜索结果 - 3
- 一个基于 IPW 的无偏双边市场排序指标
本文针对两边市场中用户间的偏见相互作用问题,提出了一个定制的无偏学习排序方法,证明了该方法满足真实排名度量的无偏性,并通过实验证明了该方法在处理稀有物品时优于基线方法。
- 自适应数据采集的政策学习
本文探讨在自适应数据收集环境下如何使用基于加权的估计算法来学习最优策略,提出了基于广义增强的倾向性加权(AIPW)估计器的算法,并建立了有限样本遗憾上限,证明最优权重方案下,算法即使在减少探索数据的情况下也能实现最小化的遗憾保证。
- 平衡策略评估与学习
提出了一种基于平衡的权重方法来评估和学习个性化决策策略,该方法适用于利用历史记录来进行个性化医疗和互联网广告,该方法明显优于现有方法。