Apr, 2024
重新思考强化学习的非分布检测:改进评估和检测方法
Rethinking Out-of-Distribution Detection for Reinforcement Learning: Advancing Methods for Evaluation and Detection
Linas Nasvytis, Kai Sandbrink, Jakob Foerster, Tim Franzmeyer, Christian Schroeder de Witt
TL;DR我们提出一种基于时间序列特征提取的新方法 DEXTER,用于检测强化学习中的异常情况,该方法在基准场景中表现出优越性能,相比现有的异常检测算法和高维度变点检测方法具有显著优势。