Jan, 2022

Bellman Meets Hawkes: 基于模型的时空点过程强化学习

TL;DR通过 Hawkes 过程建立了异步离散事件的环境动力学模型,并开发了一种基于模型的强化学习算法,用于解决社交媒体、金融和健康信息学中广泛存在的顺序决策问题。