BriefGPT.xyz
Ask
alpha
关键词
encoder-decoder video transformer
搜索结果 - 1
SalFoM: 动态视频基础模型的显著性预测
使用视频基础模型,我们引入了 SalFoM,一种新颖的编码器 - 解码器视频 Transformer 架构,通过特征提取器 UnMasked Teacher(UMT)和包含局部感知的时空 Transformer 的异构解码器,从多个角度融合
→
PDF
3 months ago
Prev
Next