Sep, 2024

NEVLP:高效视觉语言预训练的抗噪声框架

TL;DR本研究解决了视觉语言模型在大规模网络数据中存在噪声和不完整性的问题,提出了NEVLP框架,通过引入噪声自适应学习和概念增强学习策略,减少对海量预训练数据的依赖。研究表明,该框架在多种视觉语言任务中表现出色,实现了更高的效率和性能。