BriefGPT.xyz
Ask
alpha
关键词
doubly robust technique
搜索结果 - 1
ICML
双重稳健策略评估与学习
在具有上下文情境和目标函数的决策环境中,我们使用双重稳健技术评估新策略,并证明这种方法使价值估计具有较低的方差,且能达到更好的策略,为该领域提供一种有效的方法。
PDF
13 years ago
Prev
Next