BriefGPT.xyz
Ask
alpha
关键词
avsegformer
搜索结果 - 1
AVSegFormer: 基于 Transformer 的音视频分割
本文提出了一种基于 transformer 架构的音视频分割(AVS)框架 AVSegFormer,该框架引入了音频查询和可学习查询,利用注意力机制实现选择性关注有关的视觉特征,并使用中间 mask 损失增强了解码器的监督,有效解决了音视频
→
PDF
a year ago
Prev
Next