自适应系统在线强化学习决策解释

Oct, 2022

自适应系统在线强化学习决策解释

Explaining Online Reinforcement Learning Decisions of Self-Adaptive Systems

Felix Feit, Andreas Metzger, Klaus Pohl

TL;DR提出了一种结合两种可解释强化学习技术的方法，名为 XRL-DINE，可用于解释具有设计时间不确定性的自适应系统中的 Deep RL 决策。

Abstract

Design time uncertainty poses an important challenge when developing a self-adaptive system. As an example, defining how the system should adapt when facing a new environment state, requires understanding the precise effect of an adaptation, which may not be known at design time. Onlin

self-adaptive system online reinforcement learning deep rl explainable rl techniques xrl-dine

发现论文，激发创造

一项关于自适应系统可解释的在线强化学习的用户研究

在线强化学习和深度强化学习在自适应系统和可解释性 RL 技术方面的实际应用以及用户研究。

Jul, 2023

可解释性强化学习综述：概念、算法、挑战

本篇综述论文将积极介绍深度强化学习与可解释机器学习的交叉，比较了先前的方法，提出了一种补充，阐明了深度学习对智能机器人控制任务的适用性，强调机器学习与人类知识相互融合提升学习效率和性能的意义，并评估了未来 XRL 研究面临的挑战和机遇。

Nov, 2022

自动强化学习概述

论文探讨自动化强化学习的关键元素和挑战，并讨论自动化强化学习的最新工作、应用和研究方向。

Jan, 2022

强化学习用于自动驾驶系统在线测试的复制与扩展研究

复制和扩展了前一次经验研究，研究表明引入强化学习与多目标搜索相结合的方式，在深度神经网络系统的在线测试中优于其他技术（随机搜索和多目标搜索）。新的 RL 代理能够收敛到一个有效策略，明显优于随机测试，并且揭示了进一步探索如何充分利用 RL 进行在线 ADS 测试的可能改进方向。

Mar, 2024

深度强化学习简介

介绍了深度强化学习的模型、算法和技术，着重讨论与泛化相关的方面以及深度强化学习在实际应用中的使用。

Nov, 2018

面向服务系统的深度强化学习决策解释 AI 聊天机器人

通过提供自然语言解释，Chat4XAI 帮助理解 Deep RL 的决策过程，并提供了更好的易懂性、用户接受度和信任度，以及更高效的解释。

Sep, 2023

强化学习学习

本文提出了一种名为深度元强化学习的方法，该方法使用递归网络，在一个强化学习算法上进行训练，但其递归动态实现第二个、完全分离的强化学习过程，通过一系列七个验验证明了这种方法的潜在优势并提出了其可能引发的神经科学方面的重要影响。

Nov, 2016

应对动态对抗性不确定性的网络系统防御中的深度强化学习

本文根据系统状态不确定性和攻防动态的特征，提出了一个数据驱动的 DRL 框架，学习上下文感知的防御措施，以动态适应不断变化的对抗行为，同时最大程度减少对网络系统运营的影响，在多阶段攻击和系统不确定性下，DRL 算法在积极的网络防御中具有很好的效果。

Feb, 2023

深度强化学习中的可解释性

本文评估了直接将可解释性与强化学习相关联的研究，分为两类：透明算法和事后解释能力，并从解释如何潜在地启示最新的强化学习进展的角度回顾了最突出的 XAI 作品，以便在日益严峻和复杂的现实问题的未来部署中有所启示。

Aug, 2020

DEAR: 推荐系统中用于在线广告展示的深度强化学习

本文提出了一种基于强化学习的广告策略，通过设计一个新型的深度 Q 网络结构，可以连续更新其广告策略，在推荐列表中插入广告或不插入广告，并选择最优广告和最佳插入位置，使得推荐广告效果显著提升。

Sep, 2019