适用于动作识别和图像注释的循环神经网络 Fisher 向量
通过引入基于循环神经网络的新算法和三个有效的机器学习原则,即参数共享,径向基函数和对抗性训练,我们能够成功地实现未来视频特征生成和动作预测,并在行动预测方面获得了显著的进展。
Nov, 2019
本论文提出了一种通过将循环神经网络和卷积神经网络相结合运用于动作识别的算法,通过 SVM 对特征进行分类,实验结果表明,在标准数据集上,该算法提高了 14% 的识别率。
Mar, 2017
本文章提出了一个基于生成式循环神经网络的框架,用于检测动作模式并对动物的感觉 - 运动关系进行建模,在果蝇行为和在线手写字迹两种数据上进行了测试,结果表明,利用未标记的序列通过预测未来运动显著地提高了在训练标签稀缺时动作检测的表现,该网络可以学习到高级现象,如作者身份和果蝇性别,且无需监督,在将运动预测作为网络输入生成的模拟运动轨迹看起来真实,可用于定性评估模型是否学习到了生成控制规则。
Nov, 2016
本文提出使用递归神经网络模型来预测结构化的 “图像情境”,进一步研究了行为和名词实体在动作相关的语义角色中的作用,并且创新性地使用了专门的动作预测网络,以及一个 RNN 来进行名词预测。相比于之前使用条件随机场的工作,我们的系统在最近的 imSitu 数据集上获得了最佳的准确性表现,并且将从情景预测中学习到的特征转移到图像字幕生成任务中,以便更准确地描述人 - 物互动。
Mar, 2017
本文提出了一种等价于传统词袋方法的循环神经网络,但可以进行判别式训练,并允许将核计算直接整合到神经网络中,从而解决了复杂性问题;在四个最新的行动识别基准测试上进行了验证,结果表明传统模型以及稀疏编码方法都被超越。
Mar, 2017
本文对于近三十年来产生和实践了重要的循环神经网络(RNN),LSTM 和 BRNN 等模型的研究进行综述,旨在提供一个自成体系的最前沿阐述和历史视角,并引用了相关研究文献。
May, 2015
使用分层相关传递技术,比较 Fisher Vector 分类器和 Deep Neural Networks 在图像分类中对于上下文的重要性、重要分析区域和数据中的潜在缺陷和偏见等方面的差异。
Dec, 2015
L2STM 是一种通过学习独立的隐藏状态转移来增强模型的时间动力学建模能力以及解决长期时间动态不稳定的问题的方法,结合多模态训练程序,在人类动作识别方面表现优于现有的基于 LSTM 和 / 或 CNN 的方法。
Aug, 2017