全分辨率重复计数

May, 2023

Full Resolution Repetition Counting

Jianing Li, Bowen Chen, Zhiyong Wang, Honghai Liu

TL;DR本文提出结合离线特征提取和时间卷积网络从全面的时间分辨率角度理解重复动作，设计了不需要下采样即可保留所有重复内容的重复计数网络，并利用动态扩展的时间感受野框架来检索所有重复内容，实验证明该方法优于或可与其他方法相媲美。

Abstract

Given an untrimmed video, repetitive actions counting aims to estimate the number of repetitions of class-agnostic actions. To handle the various length of videos and repetitive actions, also optimization challenges in end-to-end →

repetitive actions counting full temporal resolution view repetition counting network temporal convolution networks video model training

发现论文，激发创造

上下文感知和规模无关的时间重复计数

本研究提出了一种上下文感知、不受时间尺度影响的框架，用于解决复杂重复动作的数量估计问题。通过回归方法和粗到细的循环长度细化方法，该框架能够准确地捕获不同领域的重复模式，此外，还构建了一个新的、最大的基准来促进该领域的训练和评估。

May, 2020

高效动态查询中的行动计数

视频内的动作周期重复计数是一项旨在量化重复动作周期的任务，本研究提出了一种新方法，利用动作查询表示定位重复的动作周期，并进一步开发了两个关键组件，以解决时间重复计数的基本挑战。

Mar, 2024

野外类别无关视频重复计数

本文介绍了一种利用时间自相似性作为中间表征的方法，通过一定的限制来预测视频中重复动作的周期，结果表明，该模型在现有周期性和重复计数基准测试任务上显著超越现有技术，并在新的数据集 Countix 上显示了鲁棒性。

Jun, 2020

TransRAC: 使用 Transformer 编码多尺度时间相关性用于重复行为计数

为解决现有短视频针对长视频中多样化和实际情况不足的问题，本文提出了一种包含多尺度时间关联的 transformer 编码方法和基于密度图回归的行动周期预测方法，并提供了更细致的注释来解决重复行动计数过程中的不一致现象。该方法不仅在所有数据集上均优于现有方法，而且在未经微调的未见过数据集上也表现更好。

Apr, 2022

无遗漏：全视频动作识别

通过对视频帧进行时间聚类，提出了一种全视频行为识别方法，相较于现有的基于帧采样的方法效果更好，同时由于采用了时空局部聚类和快速的哈明距离计算方法使其训练高效。

Mar, 2021

ReActNet：现实世界视频中重复活动的时间定位

本文提出了一种使用卷积神经网络对视频进行表示并使用 ReActNet 对视频进行分类的方法，以定位视频中的有重复运动的部分。该方法可处理任何数量和持续时间的重复段，并具有较好的通用性和性能。

Oct, 2019

通过视听计数重复活动

本文介绍了一种将视听融合用于视频中重复活动计数的新方法，通过使用音频信息可以在遇到困难的视觉条件下获得更精确的结果。通过引入音频学习模块和可靠性评估模块的跨模态时间交互进行分析，已经在一个数据集上对该模型进行了学习和评估，并针对具有挑战性的视觉条件引入了数据集变体。实验表明，使用音频以及其他模块可显著提高模型的性能。

Mar, 2021

FCA-RAC: 首周期注释重复动作计数

我们提出了一个名为首轮注释重复动作计数（FCA-RAC）的框架，通过标记技术、自适应采样策略、多时序颗粒度卷积（MTGC）模块和训练知识增强（TKA）策略，有效改善了现有数据集的局限性，提高了模型的泛化性能和推广到未知动作的能力。

Jun, 2024

每个镜头都重要：在视频中使用范例进行重复计数

视频重复计数是指推断视频中重复动作或运动的次数。我们提出了一种以样本为基础的方法，通过发现目标视频中重复的视频样本之间的视觉对应关系来进行计数。我们的提出的 Every Shot Counts（ESCounts）模型是一个基于注意力的编码解码器，它可以对长度不同的视频以及来自相同和不同视频的样本进行编码。在训练过程中，ESCounts 通过回归视频中与样本高度对应的位置来学习。同时，我们的方法还学习了一种能够编码普遍重复运动表示的潜在表示，我们可以用于不需要样本的零样本推断。经过对常用数据集（RepCount、Countix 和 UCFRep）的大量实验，ESCounts 在所有三个数据集上都达到了最先进的性能。在 RepCount 数据集上，ESCounts 将误差范围从 0.39 降低到 0.56，并将平均绝对误差从 0.38 降低到 0.21。详细的实验进一步证明了我们方法的有效性。

Mar, 2024

视频动作识别的持续学习方法基线

本文旨在针对视频动作识别领域提出一种有效的、高效的方法来解决模型不断学习的问题，包括使用模型信心或数据信息来选择可记忆的样本的方法，并针对此方法进行评估，得出了在小缓冲区的条件下表现出更高的学习效果。

Apr, 2023