Apr, 2024

重新思考强化学习的非分布检测:改进评估和检测方法

TL;DR我们提出一种基于时间序列特征提取的新方法 DEXTER,用于检测强化学习中的异常情况,该方法在基准场景中表现出优越性能,相比现有的异常检测算法和高维度变点检测方法具有显著优势。