May, 2024

交叉验证的离策略评估

TL;DR本文研究了离策略评估中的估计器选择和超参数调优问题,并展示了如何使用交叉验证来解决这一问题,从而验证了交叉验证在离策略评估中是可行的。