Jun, 2022

使用搜索方法的深度强化学习智能体测试方法

TL;DR利用遗传算法和机器学习模型,提出了 STARLA,一种搜索 DRL 代理策略的方法。我们将其应用于广泛使用的 Deep-Q-Learning 代理,表明它比随机测试更能发现与代理策略有关的故障,并研究了如何提取描述 DRL 代理故障情况的规则。