Jun, 2023

探索代理人环境,以优化其模型以获得更好的决策

TL;DR为了提高人工智能的决策能力,文章提出了一种基于预测和规划的决策树算法 MuZero,通过该算法对决策树进行探索和改进,显著提高了代理人的决策能力。