BriefGPT.xyz
大模型
Ask
alpha
关键词
fine-grained multimodal generation
搜索结果 - 1
4M-21:面向数十项任务和模态的任意到任意视觉模型
通过对多个多媒体形式进行联合训练和扩展,我们成功地提升了多模态模型的能力,并展示了训练一个模型以解决更多任务 / 多模态性的可能性,而不损失性能,从而实现更精细化和可控的多模态生成能力。
PDF
21 days ago
Prev
Next