适用于动作识别和图像注释的循环神经网络 Fisher 向量

Dec, 2015

适用于动作识别和图像注释的循环神经网络 Fisher 向量

RNN Fisher Vectors for Action Recognition and Image Annotation

Guy Lev, Gil Sadeh, Benjamin Klein, Lior Wolf

TL;DR该论文研究了基于循环神经网络编码、分类和预测序列的方法。通过使用 Fisher 向量和反向传播算法，该论文展示了循环神经网络在视频动作识别和图像注释等领域取得了最先进的结果，同时提供了出人意料的任务转移学习结果。

Abstract

recurrent neural networks (RNNs) have had considerable success in classifying and predicting sequences. We demonstrate that RNNs can be effectively used in order to encode sequences and provide effective representations. The methodology we use is based on →

recurrent neural networks fisher vectors backpropagation video action recognition image annotation

发现论文，激发创造

基于 RBF 核特征映射的 RNN 动作预测

通过引入基于循环神经网络的新算法和三个有效的机器学习原则，即参数共享，径向基函数和对抗性训练，我们能够成功地实现未来视频特征生成和动作预测，并在行动预测方面获得了显著的进展。

Nov, 2019

视频分割和识别的端到端生成框架

本研究提出了一种基于 Fisher 向量和时间模型相结合的端到端生成式方法来实现人类活动的分割和识别，其适用于各种视频数据集并且优于现有的最先进方法。

Sep, 2015

用于 3D 视频中动作识别的双流 RNN/CNN

本论文提出了一种通过将循环神经网络和卷积神经网络相结合运用于动作识别的算法，通过 SVM 对特征进行分类，实验结果表明，在标准数据集上，该算法提高了 14% 的识别率。

Mar, 2017

学习循环表示以进行层次化行为建模

本文章提出了一个基于生成式循环神经网络的框架，用于检测动作模式并对动物的感觉 - 运动关系进行建模，在果蝇行为和在线手写字迹两种数据上进行了测试，结果表明，利用未标记的序列通过预测未来运动显著地提高了在训练标签稀缺时动作检测的表现，该网络可以学习到高级现象，如作者身份和果蝇性别，且无需监督，在将运动预测作为网络输入生成的模拟运动轨迹看起来真实，可用于定性评估模型是否学习到了生成控制规则。

Nov, 2016

用于情境识别的循环模型

本文提出使用递归神经网络模型来预测结构化的 “图像情境”，进一步研究了行为和名词实体在动作相关的语义角色中的作用，并且创新性地使用了专门的动作预测网络，以及一个 RNN 来进行名词预测。相比于之前使用条件随机场的工作，我们的系统在最近的 imSitu 数据集上获得了最佳的准确性表现，并且将从情景预测中学习到的特征转移到图像字幕生成任务中，以便更准确地描述人 - 物互动。

Mar, 2017

针对动作识别的词袋等效递归神经网络

本文提出了一种等价于传统词袋方法的循环神经网络，但可以进行判别式训练，并允许将核计算直接整合到神经网络中，从而解决了复杂性问题；在四个最新的行动识别基准测试上进行了验证，结果表明传统模型以及稀疏编码方法都被超越。

Mar, 2017

循环神经网络在序列学习中的关键评估

本文对于近三十年来产生和实践了重要的循环神经网络（RNN），LSTM 和 BRNN 等模型的研究进行综述，旨在提供一个自成体系的最前沿阐述和历史视角，并引用了相关研究文献。

May, 2015

动作识别的记忆增强时序动态学习

提出了一种记忆增强的时间动态学习网络，利用差分记忆控制器将最显著的信息写入外部存储器，并忽略不相关的信息，增强了动作识别的效果。

Apr, 2019

分析分类器：Fisher 向量和深度神经网络

使用分层相关传递技术，比较 Fisher Vector 分类器和 Deep Neural Networks 在图像分类中对于上下文的重要性、重要分析区域和数据中的潜在缺陷和偏见等方面的差异。

Dec, 2015

基于格子长短期记忆的人类动作识别

L2STM 是一种通过学习独立的隐藏状态转移来增强模型的时间动力学建模能力以及解决长期时间动态不稳定的问题的方法，结合多模态训练程序，在人类动作识别方面表现优于现有的基于 LSTM 和 / 或 CNN 的方法。

Aug, 2017