ECCVOct, 2020

通过身体、环境和视觉 - 语义嵌入损失在视频中理解情感

TL;DR本文介绍了我们在第一届身体表现情感理解(BEEU)挑战赛中的获奖作品。我们基于情绪环境的影响和使用词嵌入的语义视觉表示的最新文献,扩展了时间段网络的框架来适应这些要求。验证了我们的方法在 “Body Language Dataset”(BoLD)的验证集上,并在测试集上实现了 0.26235 的情绪识别准确率,超过了以前最佳结果 0.2530。