AAAIJan, 2022

拟合 Q 评估的超参数选择方法及误差保证

TL;DR该研究针对 FQE 算法的超参数调优问题,提出了一种基于近似超参数选择框架的优化方法,该方法不需要超参数就可以定义一种量化且可解释的最优化标准,并验证理论误差界与实际观察的匹配。