May, 2024
硬阈值遇上进化策略在强化学习中
Hard-Thresholding Meets Evolution Strategies in Reinforcement Learning
Chengqian Gao, William de Vazelhes, Hualin Zhang, Bin Gu, Zhiqiang Xu
TL;DR本文研究了进化策略在处理现实世界问题中普遍存在的无关特征的限制,并提出了一种集成硬阈值化和自然进化策略的新方法 NESHT,通过严格的分析和实证测试,证明了 NESHT 在嘈杂的 Mujoco 和 Atari 任务等复杂决策问题中的潜力。