BriefGPT.xyz
大模型
Ask
alpha
关键词
linear time-invariant dynamical systems
搜索结果 - 2
使用马尔科夫跳跃线性系统理论表征时序差分学习算法的确切行为
本文通过探讨强化学习中时序差分学习算法与 Markov 跳线性系统(MJLS)之间的关联,为时序差分学习算法的收敛性和稳定性提供了理论支持,并在 IID 和 Markov 噪声的两种情形下提供了 TD 学习算法收敛和表现的精确性和上下界分析
→
PDF
5 years ago
连续时间、连续值干预的因果推断治疗 - 反应模型
本研究提出了一种利用线性时不变动力系统和高斯过程,能够弥补观察数据中剂量级别变化以及不定期观测的不足的方法,能够更加准确地进行多变量数据的建模和预测。
PDF
7 years ago
Prev
Next