Jun, 2024

MeMSVD: 使用增量 SVD 捕捉长程时域结构

TL;DR这篇研究论文讨论了长期视频理解的问题,提出了一种基于低秩逼近的方案来解决注意力机制的复杂性和内存存储问题,并通过大量实验验证了该方案在不同架构和任务上的优越性。