BriefGPT.xyz
Ask
alpha
关键词
word-pixel attention weights
搜索结果 - 1
F-LMM: 冻结大规模多模态模型的基础
通过冻结已训练好的 Large Multimodal Models(LMMs)并结合人机对话,我们提出了一种简单且有效的设计 F-LMM,可以在完全保留 LMMs 的通话能力的同时,在指示物镜分割和全景叙述理解等测试中实现有竞争力的性能。
PDF
a month ago
Prev
Next