从未见过的视角识别视频中的行为

Mar, 2021

从未见过的视角识别视频中的行为

Recognizing Actions in Videos from Unseen Viewpoints

AJ Piergiovanni, Michael S. Ryoo

TL;DR本文提出了基于三维表示的方法以及引入了一层新的几何卷积层，从而使当前卷积神经网络模型可以学习具有视角不变性的表示，且对于未见过的视角也可以进行识别。我们还提出了一个新的具有挑战性的未见视角识别数据集，并展示了该方法学习视角不变表示的能力。

Abstract

Standard methods for video recognition use large cnns designed to capture spatio-temporal data. However, training these models requires a large amount of labeled training data, containing a wide variety of action

video recognition cnns 3d representations viewpoint invariant representations unseen view recognition

发现论文，激发创造

无监督学习视角不变动作表示

提出一种无监督学习框架，利用未标记的数据来学习视频表示，通过学习推断不同视图的三维运动，捕捉视角不变的动作特征，以及增强视角不变特征的学习方法，并在多个数据集上证明该方法对动作识别的有效性。

Sep, 2018

用于 3D 视频中动作识别的双流 RNN/CNN

本论文提出了一种通过将循环神经网络和卷积神经网络相结合运用于动作识别的算法，通过 SVM 对特征进行分类，实验结果表明，在标准数据集上，该算法提高了 14% 的识别率。

Mar, 2017

基于 CNN 的时空表示深度分析用于行为识别

本文分析基于 2D 或 3D CNN 的视频动作识别方法，比较这些方法之间的区别和进展，并开发了一个统一框架进行公平比较，发现在动作识别方面取得了显著的提高，但准确性未有进展，探究了 2D-CNN 与 3D-CNN 模型在时空表示能力和可传递性方面的相似之处。

Oct, 2020

人体动作识别的多视点室外数据集

该论文提供了一个从多个角度观测人类行为的数据集，并在两流卷积神经网络结构配合核排名汇总的方法下获得了 74.0% 的动作识别准确率。

Oct, 2021

动作识别：从静态数据集到移动机器人

通过利用 “提议（proposals）” 方法生成行为区域的模型训练，能够在无约束视频中实现人的行为识别，无论是否存在摄像头运动；该方法在两个新的数据集中取得了超越最先进技术的性能，同时在异常行为检测场景中取得较高的成功率。

Jan, 2017

深度视频动作识别的全面研究

本文综述了 200 多篇关于视频动作识别的深度学习论文，介绍了 17 个影响模型设计的数据集和深度学习模型的发展历程，包括深度学习适应、双流网络、3D 卷积核和计算效率模型，并对几种方法在典型数据集上进行了基准测试，最后，讨论了视频动作识别面临的问题和未来的研究机会。

Dec, 2020

从未见过的视角识别动作的人造人类

本研究旨在探讨合成人类能否提高人类动作识别的性能，特别关注对不寻常拍摄视角的泛化能力，研究发现数据的合成和扩充可以带来性能的提升。

Dec, 2019

动作检测的结构化模型

本篇论文提出了一种增强标准 I3D 网络的算法，通过添加跟踪模块和图卷积网络结构，将领域知识融入模型，并在活动行为检测中获得了更好的结果表现。

Dec, 2018

视频数据中人类行为识别的深度学习方法

通过对深度学习模型的全面分析，这项研究揭示了卷积神经网络、循环神经网络和两流卷积神经网络在人体动作识别中的优势和性能差异，并强调了综合模型在实现强大的人体动作识别方面的潜力和优化的研究方向。

Mar, 2024

使用 3D 卷积神经网络学习红外动作识别的时空特征

该研究提出了一种新的基于两个流的 3D 卷积神经网络体系结构，使用光流场序列处理红外图像，应用于红外动作识别（InfAR）数据集，实验结果表明我们的方法在 InfAR 数据集上可以获得最好的平均精度（AP）表现。

May, 2017