Sep, 2021

从视觉到语言的知识迁移:如何实现和衡量?

TL;DR探究使用视觉数据来补充大型语言模型知识的方法,并提出一种基于 memory colors 任务查询和模型训练数据过滤的方法,以用于测量模型的视觉知识传输能力,并介绍了一种涉及视觉想象步骤的模型架构,并发现我们的方法可以成功用于衡量模型的视觉知识传输能力,而我们的新型模型架构在单模态环境中利用多模态知识具有良好的结果。