Mar, 2024

数据效率改进基于感知增强的 LLMs 基准

TL;DR大语言模型在计算机视觉领域中通过不同的接口机制实现图像字幕和视觉问题回答的任务,通过实验评估各种接口机制和数据集,发现现有机制在多个任务中表现更好,并识别出一种新的接口机制,在不同任务上获得接近最优的结果,并降低了训练时间。