BriefGPT.xyz
Ask
alpha
关键词
multi-granular
搜索结果 - 2
视频总结的多粒度解释集成框架
本论文提出了一个综合的视频摘要的多粒度解释框架,通过整合在片段级别和更细粒度的视觉对象级别产生解释的方法,通过使用模型无关的基于扰动的方法来在片段级解释视频摘要结果,并引入了将视频全景分割结果与基于扰动的解释方法相结合的新方法来产生对象级解
→
PDF
2 months ago
MM
Uni-EDEN: 多尺度视语联合预训练的通用编码器 - 解码器网络
本研究通过多颗粒度的视觉 - 语言代理任务对 Uni-EDEN 进行学习,以实现多模态表示提取和语言建模,并在 4 个视觉 - 语言知识下游任务中进行微调,表现出强大的泛化能力。
PDF
2 years ago
Prev
Next