In recent years, artificial intelligence (AI) systems have surpassed human
intelligence in a variety of computational tasks. However, AI systems, like
humans, make mistakes, have blind spots, hallucinate, and struggle to
generalize to new situations. This work explores whether AI can b
本研究提出了「多样性即实力(DIS)」深度强化学习训练框架,该框架可以同时训练多种类型的人工智能,以增强其能力和策略多样性,并通过模型评估和筛选方案选择最佳模型以丰富模型池并获得最终的人工智能。该方法通过在 Google Research Football(GRF)基础上进行的人工智能比赛的测试,在复杂的多智能体环境中首次使 GRF 人工智能在 5v5 和 11v11 赛道上都有很高的水平,其行为分析表明所训练的人工智能具有丰富的策略,并且消融实验证明了设计的模块有益于训练过程。