MMApr, 2022

利用多模态信息校准类别权重实现部分视频领域自适应

TL;DR本文介绍了一种名为 MCAN 的新型神经网络模型,采用多模态特征结合不同时间尺度的视频特征提取,利用聚类方法的分布信息减轻了错误类权重带来的负面影响,该模型已在 PVDA 基准测试中得到了显著的提高。