本研究提出了一种基于 Fisher 向量和时间模型相结合的端到端生成式方法来实现人类活动的分割和识别,其适用于各种视频数据集并且优于现有的最先进方法。
Sep, 2015
本文提出了一种自我监督的、基于认知心理的预测学习框架,通过自适应学习来减少循环神经网络中灾难性遗忘的影响,在三个公共数据集上进行了广泛的实验,表明所提出的方法能够优于弱监督和其他非监督学习方法最多达 24%,并具有完全监督方法相媲美的性能。同时,该方法还能够学习高度区分特征,进而提高动作识别的表现。
Nov, 2018
该研究提出了一种基于连续时间嵌入的无监督学习方法,通过鉴别视觉序列中课程的聚类段以实现发现非结构化视频中的动作。该方法被评估在三个数据集上,可以适用于未知情景下的视觉内容分析
Apr, 2019
应用叙述指导下的生成式分段模型,重点研究在无监督和弱监督设置中进行视频动作分割,发现任务结构和叙述语言在训练中被用作监督来源有利于提高分割质量.
May, 2020
本文提出了一种新颖的基于 Transformer 的框架,用于无监督活动分割,利用帧级别线索和段级别线索。我们的方法通过一个帧级别预测模块开始,该模块通过 Transformer 编码器估计逐帧动作类别。为了利用段级别信息,我们引入了一个段级别预测模块和一个帧到段对齐模块。
May, 2023
本文介绍了一种使用自监督学习和 RNN/HMM 算法实现无监督动作分割的方法,该方法优于现有技术在多个数据集上的表现。
Apr, 2021
本文研究长期视觉定位问题,提出了 Fine-Grained Segmentation Network(FGSN)用于提供更多标签的图像分割,并能自我学习以应对季节性变化,实验证明将 FGSN 的细粒度分割整合到现有的定位算法中可显著提高定位精度。
Aug, 2019
本文提出了一种新的方法学框架 ——DeepSegmenter,该框架同时在单个框架中执行活动分割和分类,以识别驾驶员的异常驾驶行为,并在 2023 年 AI 城市挑战赛的实验验证数据中取得了 0.5426 的活动重叠得分,证明了该系统的有效性、高效性和稳健性。
Apr, 2023
该论文提出了一种多粒度生成器(MGG),从不同的粒度角度利用视频视觉特征执行时间动作提议,将段提议生成器(SPP)和帧活性生产者(FAP)组合起来执行两个不同粒度的时间动作提议任务,可与现有的动作分类器一起用于视频检测任务,具有优于现有方法的性能表现。
该论文介绍了一种新的基于 HMM 的弱监督行为分割框架,其中提出了一种新的 Viterbi 算法和特征 affinities 的正则化方法来提高算法性能。
Feb, 2020