使用搜索方法的深度强化学习智能体测试方法

Jun, 2022

使用搜索方法的深度强化学习智能体测试方法

A Search-Based Testing Approach for Deep Reinforcement Learning Agents

Amirhossein Zolfagharian, Manel Abdellatif, Lionel Briand, Mojtaba Bagherzadeh, Ramesh S

TL;DR利用遗传算法和机器学习模型，提出了 STARLA，一种搜索 DRL 代理策略的方法。我们将其应用于广泛使用的 Deep-Q-Learning 代理，表明它比随机测试更能发现与代理策略有关的故障，并研究了如何提取描述 DRL 代理故障情况的规则。

Abstract

deep reinforcement learning (DRL) algorithms have been increasingly employed during the last decade to solve various decision-making problems such as autonomous driving and robotics. However, these algorithms have faced great challenges when deployed in →

deep reinforcement learning safety-critical environments search-based testing approach genetic algorithm faulty episodes

发现论文，激发创造

基于搜索的强化学习测试

研究开发了基于搜索的深度强化学习测试框架，用于评估深度强化学习代理的性能和安全性，其中包括利用搜索算法进行参考跟踪的安全测试和创建多样化的跟踪以评估代理的总体性能。

May, 2022

使用代理模型测试深度强化学习代理

使用基于搜索的方法的 Indago 工具，通过在深度强化学习中训练分类器来预测特定环境配置下机器学习代理的故障情况，以此作为适应度函数来生成更多故障环境配置，实验结果表明，此方法比现有技术多发现 50％的深度强化学习代理的故障

May, 2023

SMARLA: 深度强化学习智能体的安全监测方法

这篇论文介绍了一种基于机器学习的安全监控方法 SMARLA，适用于深度强化学习代理。SMARLA 利用状态抽象减少状态空间，并实现准确的违规预测和提前发现安全问题。

Aug, 2023

使用深度强化学习增强自动游戏测试

本研究采用深度强化学习（DRL）技术来实现自学习机制的游戏测试框架，可提高测试覆盖率，发现并解决游戏内的漏洞及其他问题，特别适用于第一人称射击类型的游戏。

Mar, 2021

强化学习用于自动驾驶系统在线测试的复制与扩展研究

复制和扩展了前一次经验研究，研究表明引入强化学习与多目标搜索相结合的方式，在深度神经网络系统的在线测试中优于其他技术（随机搜索和多目标搜索）。新的 RL 代理能够收敛到一个有效策略，明显优于随机测试，并且揭示了进一步探索如何充分利用 RL 进行在线 ADS 测试的可能改进方向。

Mar, 2024

多智能体强化学习的鲁棒性测试：对关键智能体进行状态扰动

提出了一种新颖的基于 DE 的关键代理的 Robustness Testing 框架，用于生成关键代理的对抗性状态扰动，是第一个具有不同受害者代理的鲁棒性测试框架，表现出对受害者代理数量和破坏合作策略方面的卓越性能。

Jun, 2023

合作多智能体强化学习鲁棒性综合测试

提出了一种用于 c-MARL 算法的鲁棒性测试框架 MARLSafe，此框架能够全面从三个方面（状态鲁棒性、行动鲁棒性和奖励鲁棒性）进行测试，以及多方面提出了用于 c-MARL 攻击的鲁棒性测试算法。实验证明，许多最新的 c-MARL 算法在所有方面的鲁棒性都较低，因此迫切需要测试和提高 c-MARL 算法的鲁棒性。

Apr, 2022

针对深度强化学习的隐蔽高效敌对攻击

探索针对深度强化学习的对抗攻击，并提出两种攻击技术：关键点攻击和拮抗攻击，以提高鲁棒性，实验结果显示这两种技术比现有方法更具优势。

May, 2020

深度强化学习控制的机器人和自主系统的可达性验证的可靠性评估

本文提出了一个用于 DRL 控制的机器人和自主系统的可靠性评估框架，并利用形式可靠性分析生成的验证证据，验证了其安全性。

Oct, 2022

有界预知下的 Atari 游戏防护

针对深度强化学习在安全关键领域中的应用，本研究提出了一种确保 Atari 电子游戏中 DRL 智能体安全的方法，仅需使用仿真器即可进行分析，此方法可有效提高智能体的安全性。

Jan, 2021