Jan, 2025

基于在线强化学习的实时策略任务动态自适应评估函数

TL;DR本研究解决了实时策略任务评估中缺乏适应性的问题,提出了一种基于在线强化学习的动态权重调整机制。研究发现,该方法显著提高了兰彻斯特作战模型等评估函数在规划算法中的应用效果,尤其是在较大地图尺寸下,评估函数的计算时间增长保持在6%以内,展现出在实时策略任务评估中的良好潜力。