CVPRMay, 2023

图像情感识别的高层次语境表示

TL;DR本文提出了一种从图像中提取高级语境表示的方法,利用单个线索和单个编码流与情感相关联,并且该模型的执行效率比以前的模型更高,其在 EMOTIC 数据集上达到了 0.3002 的 mAP 并且能够在消费级硬件上以每秒大约 90 帧的速度执行,容易部署在解决与情感识别相关的现实问题中。