本文综述了深度强化学习 (DRL) 的进展,包括基于价值、基于策略和基于模型的算法,并对其在游戏 AI 领域内的应用和挑战进行了讨论和总结。
Dec, 2019
该论文介绍了 CARMI:一种配置可调的智能体,使用相对度量输入以模拟玩家的游戏风格,并能够在先前未见过的游戏关卡上操作。这种方法不需要完整的游戏数据轨迹,可通过少量人工数据训练,并可用于制作视频游戏的行为和平衡研究。
Nov, 2022
利用实验性的强化学习系统增加自动化游戏测试解决方案的能力,展示了将强化学习应用于游戏开发中的用例,并提出了促进游戏产业采用机器学习和特别是强化学习的研究方向。
Jul, 2023
本文综述了深度强化学习算法在自动驾驶任务上的应用,包括分类、验证、测试和强化现有强化学习算法解决方案的方法,还介绍了相关领域和挑战。
Feb, 2020
复制和扩展了前一次经验研究,研究表明引入强化学习与多目标搜索相结合的方式,在深度神经网络系统的在线测试中优于其他技术(随机搜索和多目标搜索)。新的 RL 代理能够收敛到一个有效策略,明显优于随机测试,并且揭示了进一步探索如何充分利用 RL 进行在线 ADS 测试的可能改进方向。
Mar, 2024
利用遗传算法和机器学习模型,提出了 STARLA,一种搜索 DRL 代理策略的方法。我们将其应用于广泛使用的 Deep-Q-Learning 代理,表明它比随机测试更能发现与代理策略有关的故障,并研究了如何提取描述 DRL 代理故障情况的规则。
Jun, 2022
本文介绍 DeepRNG 框架,在随机数生成器中加入深度强化学习,通过简洁的状态表示显著改善了 Cosmos SDK 软件库的测试效果。
Jan, 2022
本研究提出了一种融合游戏特征信息的深度强化学习神经网络模型,其能够在处理 3D FPS 游戏的部分可观察状态下显著提高训练效率和性能。
Sep, 2016
提出一种自动化的游戏测试和验证方法,结合传统脚本方法和强化学习以适应新情况,测试结果表明使用学习方法和脚本人工智能相结合的代理比单独使用启发式人工智能更强大和稳健,成功率达到 57.12%。
Jun, 2024
通过提出学习挑战诊断器 (LCD) 并使用其在 Procgen 基准测试中发现新的挑战分类,研究报道了在优化深度强化学习算法时出现的多种失败情况,并为更高效的进展提供了一条路径。
Sep, 2023