BriefGPT.xyz
Ask
alpha
关键词
benchmark action recognition dataset
搜索结果 - 1
MAiVAR-T:多模音频图片和视频动作识别器使用变形器
提出了一种新模型 MAiVAR-T(Multimodal Audio-Image to Video Action Recognition Transformer),旨在融合音频和图像模态以提高多模态人体动作识别(MHAR)的效果,并在基准动
→
PDF
a year ago
Prev
Next