Feb, 2023

Q-Cogni: 一种融合因果关系强化学习框架

TL;DRQ-Cogni 是一种算法集成的因果强化学习框架,可通过自主因果关系发现方法重新设计 Q-Learning,从而在具有状态 / 动作空间的机器学习环境中实现最优学习和推理,并提高强化学习代理的决策可解释性。在应用 Q-Cogni 于车辆路径问题(VRP)中,我们将其与最先进的强化学习算法进行比较,并报告结果,表明该框架具有更好的策略、改进的学习效率和更高的代理决策的可解释性。同时与传统最短路径搜索算法进行比较,并且基于纽约市的出租车和豪华轿车委员会旅行记录数据应用 Q-Cogni 求解最佳路径选择问题,得出的结果表明在真实世界的情况下,其结果相比于最短路径搜索得到的结果有 85% 以上的数据是一样或更好的。