Bellman Meets Hawkes: 基于模型的时空点过程强化学习

Jan, 2022

Bellman Meets Hawkes: 基于模型的时空点过程强化学习

Bellman Meets Hawkes: Model-Based Reinforcement Learning via Temporal Point Processes

Chao Qu, Xiaoyu Tan, Siqiao Xue, Xiaoming Shi, James Zhang...

TL;DR通过 Hawkes 过程建立了异步离散事件的环境动力学模型，并开发了一种基于模型的强化学习算法，用于解决社交媒体、金融和健康信息学中广泛存在的顺序决策问题。

Abstract

We consider a sequential decision making problem where the agent faces the environment characterized by the stochastic discrete events and seeks an optimal →

sequential decision making stochastic discrete events model-based reinforcement learning hawkes process intervention policy

发现论文，激发创造

标记时空点过程的深度强化学习

利用深度强化学习方法，能够处理由异步、随机、离散事件构成的连续时间情形下的智能干预问题，并应用于个性化教学和病毒式营销领域，取得了比其他方法更好的效果。

May, 2018

通过强化学习学习时态点过程

这篇论文提出了一种基于增强学习方法的灵活时空点过程模型的算法，该算法可以生成满足真实数据分布的样本来评估模型质量，并采用逐步改进的策略参数化模型。模拟结果表明其在合成和真实数据中均表现良好。

Nov, 2018

强化逻辑规则学习用于暂态点过程

我们提出了一个能够逐步扩展解释性时间逻辑规则集来解释时间事件发生的框架。利用时间点过程建模和学习框架，规则内容和权重将逐渐优化，直到观察的事件序列的似然性最佳。我们的算法通过在主问题中更新当前规则集的权重，并在子问题中搜索和包含新规则来增加似然性。主问题被定义为凸问题，使用连续优化方法相对容易求解，而子问题需要在庞大的组合规则谓词和关系空间中进行搜索。为了克服这一挑战，我们提出了一种神经搜索策略，通过学习生成新规则内容的一系列动作。该策略参数将使用强化学习框架进行端到端训练，其中奖励信号可以通过评估子问题目标来高效查询。训练好的策略可以以可控的方式生成新规则。我们在合成和真实的医疗数据集上评估了我们的方法，取得了有前景的结果。

Aug, 2023

神经霍克斯过程：一种神经自调节的多元点过程

使用神经网络中的 LSTM 模型通过多维点过程建模离散事件流，可实现事件预测，包括缺失数据情况下的预测。

Dec, 2016

具有外部时间进程的马尔可夫决策过程

本文研究在外部时间过程的影响下的马尔可夫决策过程，提出了一个策略迭代算法来解决这个问题，并对其性能进行了理论分析。

May, 2023

自我关注 Hawkes 过程

提出了一种利用 self-attention 机制进行 intensity function 拟合的 self-attentive Hawkes process 方法，相较于传统的统计方法和深度循环神经网络，该方法能更好地识别时间事件之间的复杂依赖关系，并且能够捕捉更长的历史信息，可以针对多变量事件序列进行有效的复杂模式预测。

Jul, 2019

从少量事件学习 Hawkes 过程

本文提出一种基于变分期望最大化算法的有效算法，用于解决多元 Hawkes 过程的因果交互网络学习问题，可以优化超参数并考虑模型参数的不确定性，实验结果表明在短观测序列下优于现有最先进的方法。

Nov, 2019

社交媒体事件的 Hawkes 过程教程

本章介绍了点过程、特别是霍克斯过程，用于对连续时间上的离散、相互依赖的事件进行建模。我们介绍了霍克斯过程及其事件强度函数、事件模拟和参数估计方案，并描述了一个基于社交媒体数据的实际例子。我们提出了内存核的设计方法，以及如何估计参数和预测流行度的结果。代码和示例事件数据作为在线附录提供。

Aug, 2017

超越 Hawkes：空间 - 时间点过程上的神经多事件预测

提出了一种用于同时多事件预测的新神经结构，利用 transformers、normalizing flows 和 probabilistic layers，以实现 spatio-temporal Hawkes 过程的批量复杂历史相关的未来离散事件分布预测，取得了包括南加州地震，Citibike，Covid-19 和 Hawkes 合成风车数据集在内的各种基准数据集的最新性能。

Nov, 2022

基于 Hawkes 过程的狄利克雷混合模型用于事件序列聚类

本研究提出了一种有效的基于 Hawkes 过程的 Dirichlet 混合模型方法来解决事件序列聚类问题，并通过 EM 算法的内外迭代进行分析和学习，演示了该方法的优越性和稳健性。

Jan, 2017