AAAIJun, 2024

基于 LMM 的知识在图像分类任务中的利用

TL;DR使用 Large Multimodal Models 中的 MiniGPT-4 模型,结合图像编码器和文本编码器提取语义描述,以提高图像分类任务的性能。