Mar, 2023

视觉语言学习中知识的贡献:任务和挑战调查

TL;DR研究了基于视觉和语言协同的任务,考虑利用知识图谱和大型语言模型等外部知识来源填补现有 VL 预训练数据集中存在的知识缺失问题,提出了基于混合架构的解决方案,并总结了知识图谱与大型语言模型潜在对未来混合模型的影响。