BriefGPT.xyz
大模型
Ask
alpha
关键词
inverse propensity score method
搜索结果 - 1
AAAI
面向运行时不确定性的鲁棒离线学习
论文提出了一种针对运行时不确定性的离线评估方法,该方法允许所得的估算器不仅对预期中的运行时不确定性具有鲁棒性,还对观察到的和意外的运行时不确定性具有鲁棒性,并且有效地证明其在仿真和现实世界在线实验中的鲁棒性。
PDF
2 years ago
Prev
Next