Apr, 2024

R2 指标与深度强化学习增强的自适应多目标进化算法

TL;DR提出了一种基于强化学习的双深度 Q 网络优化算法结构,通过使用 R2 指标将单目标结构转化为多目标结构,以及通过评估每代算法的性能构建强化学习奖励函数,该算法在与其他基于 R2 指标的六种算法进行比较时表现出优秀的性能。