BriefGPT.xyz
Ask
alpha
关键词
inter-frame correspondence
搜索结果 - 1
融合多种模态信息的统一视频物体分割时序变换器
本文提出了 MUTR,通过统一框架和两种策略,实现了同时支持文本和音频引用的视频对象分割,实现了视频内部各帧的时序交互,从而提高了语义对齐和目标对应的准确性。MUTR 在多个数据集上都达到了更好的 J&F 性能。
PDF
a year ago
Prev
Next