ICMLMay, 2023

离线学习的指数平滑

TL;DR本文提出了一种对 IPS 进行正则化的方法,并推导出了一个可扩展的双边 PAC-Bayes 泛化界限,该界限适用于标准 IPS,证明了正则化 IPS 的实用性以及性能优越性,并提出了一种可以不需要正则化的区分情形。