Jul, 2023

模仿就是全部吗?双阶段训练下的广义决策制定

TL;DRDualMind 使用新颖的 “双阶段” 训练策略来解决现有方法所提出的挑战,可以处理跨领域,场景和具体体现的任务,并在 MetaWorld 和 Habitat 上进行了广泛的评估和实验,其表现优于其他广义智能体,MetaWorld 上成功率可达 90% 以上的 30 个任务。