BriefGPT.xyz
Ask
alpha
关键词
linear recurrent models
搜索结果 - 1
重温具有记忆单子的循环强化学习
强化学习中,使用记忆模型如 RNN 和 transformers 来处理部分可观测的马尔科夫决策过程(POMDPs),但这些模型在处理长序列时无法很好地扩展,与一种新兴的线性循环模型相比,其性能较差。我们发现这些模型的循环更新是一个幺半群,
→
PDF
5 months ago
Prev
Next