Sep, 2023

最佳和公平的激励政策评估与学习

TL;DR连同统计可减少方差的估计和鲁棒估计在内,研究了在可能违反正性的情况下的最优治疗规则的因果识别和估计,以及如公平性等约束通过约束优化处理,并提出了用于获得方差敏感性遗憾界的多参数政策类的两阶段算法。