Jul, 2024

ICCV23视觉对话情感解释挑战: SEU_309团队技术报告

TL;DR我们使用最新的多模型方法,包括语言模型(LM)和大视觉语言模型(LVLM),在基于视觉对话的情感解释生成挑战中取得了卓越的性能,超越了现有的基准,并在F1和BLEU指标上获得了显著评分,在生成准确的情感解释方面展示了杰出的能力,推动了我们对艺术中情感影响的理解。