Sep, 2023

基于深度强化学习的控制的可靠性量化

TL;DR应用随机噪声提取方法和神经网络结构,在深度强化学习控制中提出一种可靠性量化方法,通过对两个神经网络的输出差异进行评估,改进了 DRL 控制性能和模型切换的问题。