BriefGPT.xyz
大模型
Ask
alpha
关键词
unified-io 2
搜索结果 - 1
统一 IO 2:使用视觉、语言、音频和动作扩展自回归多模态模型
我们提出了 Unified-IO 2,这是第一个能够理解和生成图像、文本、音频和动作的自回归多模态模型。通过将输入和输出(图像、文本、音频、动作和边界框等)进行分词,在共享语义空间中统一不同的模态,并使用单个编码器 - 解码器变换器模型进行
→
PDF
6 months ago
Prev
Next