BriefGPT.xyz
Ask
alpha
关键词
long-term video understanding
搜索结果 - 3
MeMSVD: 使用增量 SVD 捕捉长程时域结构
这篇研究论文讨论了长期视频理解的问题,提出了一种基于低秩逼近的方案来解决注意力机制的复杂性和内存存储问题,并通过大量实验验证了该方案在不同架构和任务上的优越性。
PDF
25 days ago
CVPR
MA-LMM:用于长期视频理解的增强记忆大型多模态模型
通过在在线方式处理视频并将过去的视频信息存储在记忆库中,该研究提出了一种用于长期视频理解的高效有效模型,可以超越语言模型的上下文长度限制和 GPU 内存限制,并在多个数据集上实现了最先进的性能。
PDF
3 months ago
AAN:面向时间动作检测的属性感知网络
通过提取物体语义和模拟它们的关系,Attributes-Aware Network(AAN)在长期视频理解方面取得了优越的性能,包括在动作检测数据集 Charades 和 Toyota Smarthome Untrimmed 数据集上的表现
→
PDF
10 months ago
Prev
Next