Oct, 2022

使用逻辑状态抽象直接逼近 AIXI

TL;DR提出一种将逻辑状态抽象与 AIXI 相结合的实用方法,通过基于高阶逻辑的状态表示和推理框架,扩展了 AIXI 在复杂历史依赖和结构环境中的近似模型类,其特征是通过适当的抽象状态序列的语境树加权实现精确的贝叶斯模型学习,可与不同的规划算法相结合。实验结果表明,该智能体在控制大规模接触网络上的传染病方面表现良好。