BriefGPT.xyz
大模型
Ask
alpha
关键词
mllms' performance
搜索结果 - 1
利用视觉检测模型增强多模态大型语言模型:实证研究
通过融合先进的目标检测和光学字符识别模型,我们在多模态大型语言模型的基础上进行了实证研究,以改善对细粒度图像理解的能力并减少回应中的虚构现象。我们的研究探讨了融合检测信息的基于嵌入的方法,该方法对原始多模态大型语言模型的影响以及检测模型的互
→
PDF
5 months ago
Prev
Next