运动数据有效的无监督时序分割
本文提出了基于频率分析、零速度交叉检测和自适应 K-means 聚类的人类重复动作的时间分割方法,以处理不同采样率和准确度的人运动数据。实验结果表明,该算法可以对通过动作捕捉系统和 Microsoft Kinect 所捕获的动作数据进行鲁棒的重复性动作序列分割。
Dec, 2015
提出一种全自动且无监督的方法,使用有效的时间加权层次聚类算法,对视频进行行动划分并在五个具有挑战性的动作分割数据集上展示出明显的性能改善。
Mar, 2021
该论文提出了一种统一的模型选择技术,通过结合不同的现有模型选择技术,自动推断用于基于谱聚类的运动分割方法的运动组数,并在 KT3DMoSeg 数据集上评估了该方法在给定簇数为基准信息时与基准方法相比所取得的有竞争力的结果。
Mar, 2024
本文提出了基于光流和边缘线索的新型显着性估计技术和新型邻域图,用于解决快速运动,运动模糊和遮挡等视频分割的挑战,在 DAVIS,SegTrack v2 和 FBMS-59 数据集中取得了超越深度学习方法的最新成果。
Sep, 2018
本研究提出了一种新颖的自监督学习方法来学习对于动态运动变化有响应的视频表征,通过训练神经网络来区分不同的时间变换的视频序列,使得无需人工标注数据即可准确地识别视频中的不稳定运动并增强神经网络在小数据集上的训练。该方法经过实验证明,可显著提高 UCF101 和 HMDB51 上的动作识别的传递性能。
Jul, 2020
我们提出了一种基于解决优化传输问题的长时间、未修剪视频的动作分割任务的新方法。通过将时间一致性先验编码到 Gromov-Wasserstein 问题中,我们能够从视频帧和动作类之间的噪声亲和 / 匹配成本矩阵中解码出一个时间一致的分割。与以前的方法不同,我们的方法不需要知道视频的动作顺序以实现时间一致性。此外,我们得到的(融合的)Gromov-Wasserstein 问题可以使用几次投影镜像下降的迭代在 GPU 上高效解决。我们在无监督学习环境中展示了我们方法的有效性,其中我们的方法用于为自我训练生成伪标签。我们在 Breakfast、50-Salads、YouTube 指南和桌面装配数据集上评估了我们的分割方法和无监督学习管道,得到了无监督视频动作分割任务的最新结果。
Apr, 2024
该研究提出了一种基于转移子空间学习的无监督模型,结合了轨迹数据的几何结构信息和较大的自由度,通过 ADMM 算法实现学习辅助数据表示、非负字典和编码矩阵的优化,实验结果表明该方法在人体运动分割方面的聚类性能显著优于当前最先进的半监督转移学习方法。
Jul, 2021
该研究提出了一种基于连续时间嵌入的无监督学习方法,通过鉴别视觉序列中课程的聚类段以实现发现非结构化视频中的动作。该方法被评估在三个数据集上,可以适用于未知情景下的视觉内容分析
Apr, 2019
本文提出了一种新颖的无监督活动分割方法,该方法使用视频帧聚类作为预文本任务,并同时执行表示学习和在线聚类。通过使用时间最优传输来利用视频中的时间信息,同时,在计算伪标签聚类分配的标准最优传输模块中加入保留活动时间顺序的时间正则化项。与之前的方法相比,我们的方法不需要在离线模式下存储整个数据集的特征,而是以在线模式每次处理一个小批量。 extensive evaluations on three public datasets, i.e. 50-Salads, YouTube Instructions, and Breakfast, and our dataset, i.e., Desktop Assembly, show that our approach performs on par with or better than previous methods, despite having significantly less memory constraints.
May, 2021
本文提出了一种新的无监督行为检测方法,通过行为匹配检测共享相同人类行为的视频片段,该方法可用于发现新的行为类别、作为活动检测流程中的行为提议技术,同时还是生成视频重点的有用预处理步骤,作者在 MPII Cooking 数据集、THUMOS15 行为检测基准和 IKEA 数据集上使用三个活动识别基准评估了该方法。
Dec, 2016