MultiCounter：无剪辑视频中的多行为无关重复计数

Sep, 2024

MultiCounter：无剪辑视频中的多行为无关重复计数

MultiCounter: Multiple Action Agnostic Repetition Counting in Untrimmed Videos

Yin Tang, Wei Luo, Jinrui Zhang, Wei Huang, Ruihai Jing...

TL;DR本研究解决了在无剪辑视频中计数多实例重复动作的挑战。提出的MultiCounter框架可同时检测、跟踪和计数多个实例的重复动作，并通过引入新的模块提升了模型效率和准确性。实验结果表明，MultiCounter在MRAC领域设定了新的基准，并显著提高了计数的准确率与实时性能。

Abstract

Multi-instance Repetitive Action Counting (MRAC) aims to estimate the number of repetitive actions performed by multiple instances in untrimmed videos, commonly found in human-centric domains like sports and exercise. In this paper, we propose MultiCounter, a fully end-to-end

发现论文，激发创造

上下文感知和规模无关的时间重复计数

本研究提出了一种上下文感知、不受时间尺度影响的框架，用于解决复杂重复动作的数量估计问题。通过回归方法和粗到细的循环长度细化方法，该框架能够准确地捕获不同领域的重复模式，此外，还构建了一个新的、最大的基准来促进该领域的训练和评估。

May, 2020

TransRAC: 使用Transformer编码多尺度时间相关性用于重复行为计数

为解决现有短视频针对长视频中多样化和实际情况不足的问题，本文提出了一种包含多尺度时间关联的transformer编码方法和基于密度图回归的行动周期预测方法，并提供了更细致的注释来解决重复行动计数过程中的不一致现象。该方法不仅在所有数据集上均优于现有方法，而且在未经微调的未见过数据集上也表现更好。

Apr, 2022

全分辨率重复计数

本文提出结合离线特征提取和时间卷积网络从全面的时间分辨率角度理解重复动作，设计了不需要下采样即可保留所有重复内容的重复计数网络，并利用动态扩展的时间感受野框架来检索所有重复内容，实验证明该方法优于或可与其他方法相媲美。

May, 2023

基于关节的姿态重复行为计数模型：改进性能的PoseRAC

基于关节角和身体姿势标志，本研究解决了相机视角变化、过度计数、欠计数、子动作区分困难、姿势识别准确性等问题，在 RepCount 数据集上取得了优于最先进 RepCount 方法的结果，均方绝对误差为 0.211，计数准确性（Off-By-One）为 0.599，实验证明了我们方法的有效性和鲁棒性。

Aug, 2023

高效动态查询中的行动计数

视频内的动作周期重复计数是一项旨在量化重复动作周期的任务，本研究提出了一种新方法，利用动作查询表示定位重复的动作周期，并进一步开发了两个关键组件，以解决时间重复计数的基本挑战。

Mar, 2024

IVAC-P2L: 通过不规则重复先验提升视频动作计数

我们的研究通过引入一种名为不规则视频动作计数（IVAC）的新方法，解决了传统视频动作计数方法在忽视动作重复复杂性方面的不足，并提出了一种包括一致性和不一致性模块以及独特的拉-推力损失机制支持的新方法，该模型在视频动作计数任务性能上创造了新的基准，并在不同视频内容上展现出了出色的适应性和泛化性能。

Mar, 2024

每个镜头都重要: 在视频中使用范例进行重复计数

视频重复计数是指推断视频中重复动作或运动的次数。我们提出了一种以样本为基础的方法，通过发现目标视频中重复的视频样本之间的视觉对应关系来进行计数。我们的提出的Every Shot Counts（ESCounts）模型是一个基于注意力的编码解码器，它可以对长度不同的视频以及来自相同和不同视频的样本进行编码。在训练过程中，ESCounts通过回归视频中与样本高度对应的位置来学习。同时，我们的方法还学习了一种能够编码普遍重复运动表示的潜在表示，我们可以用于不需要样本的零样本推断。经过对常用数据集（RepCount、Countix和UCFRep）的大量实验，ESCounts在所有三个数据集上都达到了最先进的性能。在RepCount数据集上，ESCounts将误差范围从0.39降低到0.56，并将平均绝对误差从0.38降低到0.21。详细的实验进一步证明了我们方法的有效性。

Mar, 2024

浏览后聚焦：整合上下文和细粒度视图用于重复动作计数

提出了一种名为SkimFocusNet的双分支网络方法，通过粗略浏览与目标动作匹配的全局信息以及精确逐帧识别重复动作来实现行为计数，并在Multi-RepCount数据集上展示了其在多种重复动作无误计数方面的鲁棒性能，取得了最先进的成果。

Jun, 2024

FCA-RAC: 首周期注释重复动作计数

我们提出了一个名为首轮注释重复动作计数（FCA-RAC）的框架，通过标记技术、自适应采样策略、多时序颗粒度卷积（MTGC）模块和训练知识增强（TKA）策略，有效改善了现有数据集的局限性，提高了模型的泛化性能和推广到未知动作的能力。

Jun, 2024

重新思考重复动作计数的时间自相似性

通过学习嵌入并预测行动开始的概率，推断出重复行动的数量。我们根据生成的参考 TSM 提出了一种基于损失的新框架，实现了在三个数据集上的最先进结果。

Jul, 2024