BriefGPT.xyz
Ask
alpha
关键词
self-excitation
搜索结果 - 2
离线强化学习中 Q 值离散度的理解、预测和改善
在离线增强学习中,离线 Q 值估计的发散问题一直是一个突出的问题。本研究通过对机制的全面理解和对模型架构的改进,提出了解决发散问题的新途径,其中包括基于离线 RL 的自激励模式和通过 LayerNorm 架构提升性能。
PDF
9 months ago
带格点重整因子的 Hawkes 过程核结构参数搜索
通过引入重整化因子,我们提供了一种解决非协调、不稳定的优化方法来最大化 Hawkes 过程相关对数似然函数的方法,并提高了一系列不同长度序列的最大似然估计方法性能。
PDF
6 years ago
Prev
Next