BriefGPT.xyz
大模型
Ask
alpha
关键词
sparse transformer architecture
搜索结果 - 1
走向更统一的上下文视觉理解
我们提出了一种新的具有多模态输出功能的视觉理解的上下文学习框架,通过将文本和视觉提示量化和嵌入到统一的表示空间中,并采用仅具有解码器的稀疏 Transformer 架构在其上执行生成建模。实验结果表明,我们的模型在统一的多模态管线中实现了与
→
PDF
7 months ago
Prev
Next