BriefGPT.xyz
Ask
alpha
关键词
visual-language representation learning techniques
搜索结果 - 1
CVPR
增强 Transformer 主干网络,用于自我中心视频动作分割
本研究提出了两种新颖的想法来增强用于行动分割的 transformer,第一,我们引入了双扩张注意机制来自适应地捕获局部到全局和全局到局部上下文中的分层表示。第二,我们在编码器和解码器块之间加入跨连接以防止解码器丢失局部上下文。此外,我们利
→
PDF
a year ago
Prev
Next