Mar, 2023

利用多模态场景信息的情感感知

TL;DR利用预训练视觉语言模型从图像中提取前景环境描述,并结合其他多元素素进行情感预测,在自然环境和电视秀等数据集中取得了可行的结果。