BriefGPT.xyz
Ask
alpha
关键词
video perceiver
搜索结果 - 1
VaQuitA: 提升 LLM 辅助视频理解中的对齐能力
最近,基于语言模型的视频理解取得了令人瞩目的进展,这得益于大型语言模型(LLMs)的引入。然而,以往的研究重点主要集中在设计将视频特征映射到标记的投影层,这种方法既基础又低效。在我们的研究中,我们引入了一个最先进的框架 VaQuitA,旨在
→
PDF
7 months ago
Prev
Next