Sep, 2023

重要性加权的线下学习方法

TL;DR离线策略优化, 随机情境赌博问题,重要性加权估计,隐性探索估计,PAC-Bayesian 策略类的改进