Jun, 2021

绿色安全中极小后悔的强化学习

TL;DR该研究旨在针对绿色安全领域中的不确定性制定有韧性的顺序巡逻计划,以解决对保护者来说具有威慑效应的问题,并提出了一种基于强化学习的算法来找到一个更加稳健的决策策略。