Feb, 2024

MM-Soc: 社交媒体平台上多模态大型语言模型的基准测试

TL;DR社交媒体是多模态信息交流的中心,包括文本、图片和视频,这对机器来理解在线空间中的信息或情感相关的交互构成了挑战。本文介绍了 MM-Soc,一个综合性基准,旨在评估多模态大型语言模型对多模态社交媒体内容的理解能力。通过我们对四个开源多模态大型语言模型的十个规模变体的详尽评估,我们发现了重要的性能差异,突出了模型在社交理解能力方面的改进需求。