CVPRApr, 2024

EmoVIT:利用视觉指令调整革新情绪洞察

TL;DR以 EmoVIT 架构为基础,使用 GPT 辅助流程生成情感视觉指令数据,并通过广泛实验证明了模型在情感分类、情感推理和幽默理解方面的能力,为语言模型时代的情感视觉指导调整提供了强有力的基准,并为未来的探索打开了新的可能性。