KDDApr, 2020

深度强化学习智能体行为的实证研究

TL;DR通过对深度强化学习的智能体的策略网络进行局部网络消融,我们发现健康智能体的行为是通过网络层激活与执行行为之间具有特定的相关模式所表征,并且健康智能体的学习表征在其激活空间中具有反映其不同行为阶段的特定模式,在网络消融时,这些模式被扭曲,导致智能体无法完成其训练控制任务。因此,我们提出了对人工神经网络的一种新的实证研究视角,以确保人工神经网络在透明度和可解释性方面具有科学可证伪性的标准。