- 基于关注机制的时空网络卷积神经网络用于凋亡分类
我们的研究提出了基于目标细胞的视频序列的关注图时空图卷积网络方法用于细胞死亡的分类,考虑到多个目标细胞之间的交互作用以及空间和时间关系。
- 视频实例抠图
视频实例抠图领域研究近期的课题主要集中在视频序列中每个实例的阿尔法抠图的精准性和时间一致性,提出了 Mask Sequence Guided Video Instance Matting(MSG-VIM)作为视频实例抠图的基线模型,通过混合 - 一次性进行的无监督运动分割:对视频进行平滑长期建模
提出了一种基于长期时空模型的运动分割方法,该方法通过处理光流场序列,以无监督学习的方式提供视频中一致运动的分段,为计算机视觉任务和无监督视频表示学习提供了先决条件。
- 应用神经网络的视频场景定位识别
该论文使用人工神经网络研究了通过小型重复拍摄地点(如电视连续剧)的视频序列进行场景识别的可能性,并通过预训练的单图像预处理卷积网络选择每个场景的一组帧,通过神经网络的后续层分类场景位置。研究发现只有部分方法适用于该任务。
- TAPIR: 使用逐帧初始化和时间细化技术追踪任意点
本研究提出了一种名为 TAP 的新型模型,能在视频序列中高效地跟踪任何查询点,包含匹配阶段和细化阶段,且比基准方法表现更优,可快速适用于长且高分辨率的视频序列,具有实时的跟踪速度。
- CVPR预测性视频转换器
提出了一种名为 AVT 的模型,它是一种基于注意力机制的端到端视频建模架构,通过关注之前观察过的视频来预测未来的动作,通过在训练时同时预测视频序列中的下一个动作。与现有的时序汇聚策略相比,AVT 在保持观察到的动作的时序进展的同时捕捉了长时 - Vid2CAD: 使用视频的多视角约束进行 CAD 模型对齐
该研究在处理 CAD 模型和多个物体出现在视频场景中的对齐问题中,提出一种基于神经网络和多视角约束的方法,自动恢复每个物体的九自由度姿态参数,提高物体的位姿参数估计精度,重建单个 CAD 表征的场景,与现有单帧方法进行比对,在 Scan2C - MM广播比赛视频中追踪个体运动员的混合方法
本研究提出了一种快速而准确的运动员追踪解决方案,通过结合几个模型以在相对较小的硬件上并行执行来追踪运动员,最终能够在高清视频上以 80 fps 的速度处理,可以达到一定的准确率。
- 图像动画的一阶运动模型
本文描述了一种基于自监督学习的框架,可以将一个源图像中的对象根据驱动视频的运动进行动画处理,而不需要使用任何注释或有关特定对象的先前信息。使用一个经过训练的视频集合,我们的方法可以应用于此类对象的任何对象。
- 改进的条件性 VRNNs 用于视频预测
本文提出了一种基于层次结构的潜变量模型来提高模型表达能力,减少模糊预测,用于视频序列的未来帧预测任务,经过实验证明本方法在不同数据集上优于现有的潜变量模型。
- FutureGAN: 使用渐进式增长的 GAN 模型和时空 3D 卷积预测视频序列的未来帧
本文介绍了一种新的编码器 - 解码器对抗生成网络模型 FutureGAN,它可以在过去一段时间的视频帧的基础上预测未来的帧,采用了视空间 3D 卷积,扩展了渐进式 GAN 的概念,并且在 MovingMNIST,KTH Action 和 C - 视频序列中的口罩提取
通过使用 ConvLSTM-FCN 模型,在视频序列中进行人脸部分的面具分离,利用分割损失函数进行优化,使分割模型在 300VW 数据集上的性能指标平均交并比达到了 63.76%。
- 从单个运动模糊图像中学习提取视频序列
本文提出了一种从单张运动模糊图像中提取视频序列的方法,使用深度学习方案逐步重构时间排序。该方法可以成功地从单张运动模糊的图像中检索到清晰的图像序列,可以在不同的相机捕捉到的合成和真实数据集上很好地推广。
- MM基于残差帧的稀疏重构技术实现的可扩展视频超分辨率框架
文章提出了一个基于稀疏表示和压缩感知的超分辨率框架,用于在侦察和监视应用中对可扩展视频进行处理,实验结果表明,该框架具有更高的压缩率和更高的视频质量,是一种有效的压缩率更高、图像质量更优的视频处理算法。
- 分层深度时间模型用于群体活动识别
本文针对视频序列中的团体活动行为分类问题,基于 LSTM 模型构建了一个 2 阶段的深度时间模型,同时考虑了个体和群体层面的动态信息,通过在排球视频数据集上的实验验证了该模型的有效性。
- 深度预测编码网络用于视频预测和无监督学习
通过建立一个具有预测编码特点的预测神经网络 (PredNet),本文探讨了将预测未来的视频帧作为无监督学习的规则来学习视觉世界结构的问题。 在对计算机生成的物体的运动进行鲁棒的学习的同时,也能够缩短学习视野并从中获得内部表示。此外,这种网络 - 视频艺术风格迁移
本研究提出了一种基于图片样式迁移的视频样式迁移方法,使用新的初始化和适用于视频的损失函数能够生成一致和稳定的艺术风格视频序列,即使在大运动和强遮挡的情况下,该方法在质量和数量上都明显优于基线算法。
- ICCV使用光流方向进行移动相机视频的连贯运动分割
本文提出了一种运动分割算法,通过使用光流方向代替完整的光流向量,以及使用概率模型自动估计观测到的独立运动数量,实现了对具有相似世界实际运动的像素进行聚类,从而有效避免了景深不同导致的深度相关分割。该系统在多个基准测试视频中表现出鲁棒性,特别 - 从短序列预测人体 3D 姿势
本文介绍一种利用视频序列中连续帧的运动信息来恢复人体 3D 姿态的高效方法,直接从时空块回归到中间帧的 3D 姿态,克服了模糊和提升了现有方法的性能。