Jun, 2024
使用多模式分层交叉注意力模型标记在线视频中的喜剧恶作剧内容
Labeling Comic Mischief Content in Online Videos with a Multimodal Hierarchical-Cross-Attention Model
Elaheh Baharlouei, Mahsa Shafaei, Yigeng Zhang, Hugo Jair Escalante, Thamar Solorio
TL;DR我们提出了一种新颖的端到端多模态系统用于探测在线媒体中的可疑内容,特别是针对喜剧恶作剧这一子类别。