BriefGPT.xyz
大模型
Ask
alpha
关键词
doubly robust method
搜索结果 - 3
利用替代性结果进行连续治疗效果评估
在许多实际因果推断应用中,主要结果(标签)通常部分缺失,特别是如果它们昂贵或难以收集。本文研究了替代变量在估计连续性处理效应中的作用,并提出了一种双重稳健方法,以有效地将替代变量纳入分析中,该方法使用标记和未标记数据,并不受选择偏差问题的影
→
PDF
5 months ago
稀疏强化学习的双重稳健方法
我们提出了一种新的遗憾最小化算法,用于具有稀疏线性马尔可夫决策过程(SMDP)的情节性问题,其中状态转移分布是观察特征的线性函数。
PDF
8 months ago
AAAI
面向运行时不确定性的鲁棒离线学习
论文提出了一种针对运行时不确定性的离线评估方法,该方法允许所得的估算器不仅对预期中的运行时不确定性具有鲁棒性,还对观察到的和意外的运行时不确定性具有鲁棒性,并且有效地证明其在仿真和现实世界在线实验中的鲁棒性。
PDF
2 years ago
Prev
Next