BriefGPT.xyz
Ask
alpha
关键词
multimodal learning tasks
搜索结果 - 1
VisualRWKV:探索用于视觉语言模型的递归神经网络
通过引入一种线性循环神经网络模型到多模态学习任务中,该研究提出了 VisualRWKV,它是首个应用线性 RNN 模型到视觉语言模型中的尝试,并通过数据相关的循环和提示增强建模能力,以及 2D 图像扫描机制来丰富对视觉序列的处理,实验证明
→
PDF
17 days ago
Prev
Next