Feb, 2024

RadDQN: 基于深度 Q 学习的最小辐射暴露路径发现架构

TL;DR近期深度强化学习技术在自动化领域引起了广泛关注,本文介绍了一种基于深度 Q - 学习的架构(RadDQN),该架构利用感知辐射的奖励函数,为辐射区域提供了时间高效的最小辐射暴露路径,并通过一套独特的探索策略进行优化。与基准方法相比,我们的模型在收敛速度和训练稳定性方面表现出更高的优势。