学习连续视频流
本研究介绍了通过在连续视频流中训练扩散模型的可行性,并通过引入两个新的持续视频生成建模基准数据集 —— 终身弹跳球和 Windows 95 迷宫屏幕保护程序,证明了扩散模型可以通过经验重放在线有效地训练,其性能与使用相同梯度步数训练的独立同分布样本的模型相当。
Jun, 2024
在动态环境中,在线、单通、类增的情况下,我们利用基于贝叶斯的框架和在线内存回访的有效方法来解决这个挑战性的 lifelong learning 问题,并在实验证明了我们的方法超越了此前的研究成果。
Jan, 2023
在视频持续学习中,我们提出了一种名为 SMILE 的新型重播机制,通过个体 / 单帧对有效视频持续学习进行了改进,并在 Kinetics、UCF101 和 ActivityNet 数据集上实现了最先进的性能,优于之前的最新技术达 21.49%。
May, 2023
本文探讨了视频与语言学习中基于单帧的模型的应用,结果表明在大规模预训练条件下,采用适当的帧合并策略的单帧训练模型在某些视频与语言任务方面表现更佳,并且作者提出了两个基于现有细粒度动作识别数据集的检索任务,以便更全面地评估视频与语言模型。
Jun, 2022
在线持续学习在不断变化的数据流中直接学习,并存储来自该流中的最少量数据,本文通过对国内外文献中解决在线持续学习问题的方法进行实证评估,重点关注图像分类中的增量类别设置,通过比较在 Split-CIFAR100 和 Split-TinyImagenet 数据集上的平均准确率、遗忘性、稳定性和表示质量的指标,发现大多数方法都存在稳定性和欠拟合问题,但所学习的表示与相同计算预算下的独立同分布训练相当。同时发现基本的经验回放方法,经过适当调整和实施,是一种非常强大的基准方法。我们在 avalanche 框架上发布了我们的模块化和可扩展的代码库来复现我们的结果,并鼓励未来的研究。
Aug, 2023
从单目视频序列中学习单张图像深度估计模型是一个非常具有挑战性的问题。在本文中,我们提出了一种新颖的训练损失,使我们能够在训练过程中包含更多图像以进行监督。我们提出了一个简单而有效的模型来考虑帧与帧之间的像素运动。同时,我们还设计了一种新颖的网络架构来进行单张图像估计。当结合在一起时,我们的方法在自监督设置下,在 KITTI 数据集上产生了最先进的结果。
Oct, 2023
提出一种新的基于神经网络的方法,该方法利用类似人类的注意机制来自主地以像素为单位学习视频流的表示,本文的实验表明,该方法可以在少量监督的情况下进行开放式类增量分类。
Apr, 2022
通过使用预训练的方法,我们提出了一个通用的框架来持续学习连续到达的任务,从一个理论的角度,我们将其目标分解为三个层次的组成部分,包括任务内预测、任务标识推断和任务适应预测,并提出了一种创新的方法来显式优化这些组件,通过参数高效的微调技术和表示统计量,我们在下游连续学习中实证展示了我们方法的优越性和普遍性,并进一步探讨了在上游连续学习中应用参数高效的微调技术的可行性,同时结合神经科学中的最新进展,讨论了所提框架的生物学基础。
Oct, 2023
本文研究了自我监督学习在连续流数据中的应用及其效率,提出了重放缓存与最小冗余样本的方法来增强学习。实验结果表明,这些方法可以有效提高表示学习的精度和鲁棒性,在非平稳的语义分布下也不容易出现灾难性遗忘。
Mar, 2022