BriefGPT.xyz
Ask
alpha
关键词
large vision language model
搜索结果 - 3
SoMeLVLM:用于社交媒体处理的大型视觉语言模型
通过介绍一种用于社交媒体处理的大型视觉语言模型(SoMeLVLM),该模型具备知识与理解、应用、分析、评估和创造等五个关键能力,在处理多种社交媒体任务方面取得了最先进的性能。
PDF
5 months ago
LEMMA: 用外部知识增强的 LVLM 增强型多模态误信息检测
利用 Large Vision Language Model(LVLM)及外部知识增强的 LEMMA 方法,大幅提升了多模态错误信息检测的准确性。
PDF
5 months ago
CVPR
如何将大型视觉语言模型专门化为数据稀缺的 VQA 任务?A:利用未标注图像进行自我训练!
本文介绍了一种自学习数据增强策略,可以在小规模的视觉问答数据集上优化大视觉语言模型,从而增强对对抗性搜索、反事实例子和重述的鲁棒性,提高领域泛化能力,并保留更多数字推理技能。
PDF
a year ago
Prev
Next