May, 2020

使用Actor-Critic强化学习在受控感知下的异常检测

TL;DR本文提出了一种利用二进制传感器测量识别异常的算法,将问题转化为在Markov决策过程框架下的顺序假设检验问题,使用Actor-Critic深度强化学习算法解决,并在数值实验中证明了其在适应任何未知统计依赖模式的处理过程方面的优异性能。