BriefGPT.xyz
Ask
alpha
关键词
object-region video transformers
搜索结果 - 1
CVPR
目标区域视频转换器
本文提出了 Object-Region Video Transformers (ORViT)—— 一种基于对象的视觉转换方法,通过融合早期层的对象间信息直接影响整个网络的时空表示。我们的模型通过面向对象的自我关注和分离对象的动态特征来捕获物
→
PDF
3 years ago
Prev
Next