May, 2024

研究选择对于深度强化学习在航天控制中的影响

TL;DR该论文研究了使用离散动作空间,以及探索选择提供给智能体数量对其在训练期间和之后的表现的影响,针对检查任务和停靠任务的需求。结果显示对于检查任务,有限数量的离散选择导致最佳性能,而对于停靠任务,连续控制导致最佳性能。