May, 2021

用于空中对空战斗的分层强化学习

TL;DR人工智能在国防工业中的应用越来越重要,Lockheed Martin 在参加 DARPA AlphaDogfight Trials 竞赛时,使用基于 Hierarchical 架构与最大熵强化学习(RL),通过奖励塑形整合专业知识,并支持策略的模块化方法,取得了第二名的好成绩,并在比赛中击败了美国空军 F-16 武器教官课程的毕业生。