Aug, 2023

进化直接策略搜索中的广义提前停止

TL;DR提出一种早期停止方法,适用于直接策略搜索问题,通过观察每个时间步骤的目标值来停止评估,无需问题特定的知识,可以节省高达75%的计算时间。与问题特定的停止标准相比,性能相当,并且具有更广泛的适用性。