BriefGPT.xyz
Ask
alpha
关键词
four-stage training pipeline
搜索结果 - 1
InfiMM-HD:高分辨率多模态理解的巨大跃进
为了解决多模态大型语言模型在处理高分辨率图像时的准确识别和理解复杂细节方面的挑战,我们提出了 InfiMM-HD,一种专门设计用于处理不同分辨率图像的创新架构,能够提高模型的视觉感知能力,同时降低计算成本。经验证明 InfiMM-HD 具有
→
PDF
4 months ago
Prev
Next