MMOct, 2021

使用超图世界模型中的最大似然路径进行目标无关规划

TL;DR本研究提出了一种基于超图的机器学习算法,一种数据结构驱动的维护方法,以及一种基于概率应用 Dijkstra 算法的规划算法,从而形成了一个目标不可知的自动化学习代理计划引擎,该引擎结合了经典机器学习和传统人工智能的有益特性。我们证明了该算法能够在问题空间内确定最优解,在数学上限制了学习性能,并提供了一种数学模型,分析了系统状态在时间上的进展,从而得出了学习曲线、目标实现率和抽象和不确定性响应的明确预测。为了验证性能,我们展示了将代理应用于三个典型的计划问题的结果,并突出了阐明的特性的实证结论。