May, 2024

将多模态大型语言模型适应长尾开放世界中的概念漂移

TL;DR本文研究了长尾的开放世界情景对多模态大语言模型的影响,提出了一种统一框架来解决由长尾问题、尾漂移和分布漂移导致的偏差,并在视觉语言模型的预训练中改善了图像 - 文本对齐的效率和准确性。