BriefGPT.xyz
Ask
alpha
关键词
cogvlm
搜索结果 - 2
HPE-CogVLM:基于视觉语言模型的新头部姿势定位任务探索
本研究使用 CogVLM 的视觉定位能力,提出了一种新的框架来增强头部姿态估计任务,通过改进大语言模型中的灾难遗忘问题和引入 LoRA 层模型合并方法,有效提高头部姿态估计性能,并且在多个指标上优于现有方法。
PDF
a month ago
CogVLM:预训练语言模型的视觉专家
CogVLM 是一种强大的开源视觉语言基础模型,通过可训练的视觉专家模块在注意力和前馈网络层之间填补了预训练语言模型和图像编码器之间的差距,实现了视觉语言特征的深度融合,而不会牺牲在自然语言处理任务上的性能, 在 10 个经典的跨模态基准测
→
PDF
8 months ago
Prev
Next