ODN:打开深度网络进行开放式动作识别
本文提出了一种基于深度卷积神经网络的两通道ConvNet架构,结合了空间和时间网络,利用稀疏光流信息进行训练并使用多任务学习提高模型性能,成功地提高了视频动作识别的准确率。
Jun, 2014
该研究提出了一种新型的OpenMax模型,通过引入Meta-Recognition概念到网络的倒数第二层的激活模式中,估计输入图像来自未知类别的概率,从而实现深度学习神经网络的开放式识别,极大地提高了开放式识别准确性。
Nov, 2015
该研究提出了一种新颖的深度监督神经网络模型,利用了视觉跟踪,并结合了深度卷积神经网络(CNN)和循环神经网络(RNN)的鲁棒性来进行视频动作识别任务。研究结果表明,该模型在UCF101和HMDB51这两个具有挑战性的数据集上表现出色,仅使用卷积特征就可以达到最先进的水平。
Jul, 2016
本文提出了一种新的视频动作识别框架-TSN,并探究了在时间段网络的帮助下学习ConvNet模型的一系列良好实践策略。实验结果表明,本方法在HMDB51(69.4%)和UCF101(94.2%)数据集上取得了最先进的性能。我们还可视化了学习到的ConvNet模型,定性展示了时间段网络和所提出良好实践的有效性。
Aug, 2016
本论文提出了一种新的深度神经网络框架,称之为3D-RPN网络,能够在纯粹利用外观的情况下有效地编码动作的时间方面。这个模型是端到端可训练的,可以在单个步骤中联合优化动作定位和分类。在测试时,该网络预测了包含两个连续帧的微小管,而新算法则能够利用网络学习的时间编码来将它们组合成完整的动作管,计算时间减少了50%。实验结果证明,该模型在仅利用外观的情况下优于同类方法,在J-HMDB-21和UCF-101动作检测数据集上表现良好。
Apr, 2017
使用卷积神经网络,结合误差嵌入器和解码器的多任务学习方法来提高开放式图像识别准确度,同时使用极值理论来模拟未知类别的误差,实验结果表明此方法优于现有的开放式识别算法。
Mar, 2019
本文提出原型为基础的开放式深度神经网络(P-ODN)进行开放集识别任务,将原型和原型半径一起训练,指导卷积神经网络获取更具有辨别性的特征,并采用基于特征和原型之间的距离度量的多类三元组阈值方法检测未知,从而动态包含新类别,实验结果表明,P-ODN可以有效地检测未知,并且只需要少量的样本进行人工干预来识别新类别。
May, 2019
本文提出了一种基于时间注意力关系网络的方法,通过利用注意力机制执行时间对齐,并在视频片段级别上学习深度距离度量,从而在少样本和零样本动作识别方面取得了优越的实验结果。
Jul, 2019
本文提出了一种基于Deep Evidential Action Recognition(DEAR)的方法,该方法通过模型校准、对抗学习等方式,对开放测试集中的动作进行识别,并有效介入了人体动作的静态偏差。实验表明,该方法应用于多个主流动作识别模型和基准测试中,均可获得显著的性能提升。
Jul, 2021