BriefGPT.xyz
Ask
alpha
关键词
visually-augmented
搜索结果 - 1
ICLR
视觉增强语言建模
提出了一种名为 VaLM 的预训练框架,对语言建模进行视觉增强,通过图像检索模块检索相应图像,使用视觉知识融合层使多模态语言建模可以参考文本和图像的视觉知识,并在需要的情况下获取相关联的图片,通过对各种视觉知识密集型的常识推理任务的评估,展
→
PDF
2 years ago
Prev
Next