BriefGPT.xyz
Ask
alpha
关键词
linear rnns
搜索结果 - 3
VisualRWKV:探索用于视觉语言模型的递归神经网络
通过引入一种线性循环神经网络模型到多模态学习任务中,该研究提出了 VisualRWKV,它是首个应用线性 RNN 模型到视觉语言模型中的尝试,并通过数据相关的循环和提示增强建模能力,以及 2D 图像扫描机制来丰富对视觉序列的处理,实验证明
→
PDF
17 days ago
层次门控循环神经网络用于序列建模
提出了一种具有遗忘门的分层门控递归神经网络 (HGRN) 模型,其中遗忘门受可学习值下界限制,使得上层能够建模长期依赖,而下层能够建模更局部、短期的依赖关系。通过在语言建模、图像分类和长距离竞技场测试中进行实验,证明了该模型的高效性和有效性
→
PDF
8 months ago
线性 RNN 的隐性偏差
研究说明传统的循环神经网络(RNNs)在需要长期记忆的任务上表现不佳的原因是因为其随机初始化后的转移矩阵方差造成了梯度消失和梯度爆炸的问题,而使用线性 RNNs 代替时会出现更短的记忆偏差,这一理论经过人工数据和真实数据的验证。
PDF
3 years ago
Prev
Next