Mar, 2024

关于价值函数的有限表达能力及其与统计 (非) 效率的联系

TL;DR通过一系列的案例研究,本文深入探讨了模型识别和无模型方法之间的权衡,重点关注了在政策评估的核心问题上,价值函数空间内无法准确表示转移动态信息的情况,揭示了价值函数的表达能力限制是低效的驱动因素。