本文提出了一种从篮球运动员的第一人称视频中预测其未来运动轨迹 (位置和视线方向) 的方法,该方法利用了第一人称视频中独特的学习信号和 3D 重建技术,通过 Siamese 神经网络和长期循环卷积网络实现了对未来运动的预测。
Nov, 2016
使用一张第一人称视角的图片,通过 12 维相机配置轨迹生成篮球运动序列,并通过卷积神经网络和目标检查器网络来验证和细化相机配置序列以实现更真实的篮球运动序列。
Mar, 2018
本文提出了一种新的半孪生卷积神经网络架构,以解决第一人称和第三人称视频之间的人物层面的对应关系问题,在关注联合场景理解,物体追踪和活动识别方面有显着的性能提升。
Apr, 2017
本研究提出了一种新颖的深度神经网络体系结构,通过半监督的方法,总结第一人称视频中的关键视空间信息,其中利用第三人称视频作为训练数据,并在实验中展示了这个模型的定性和定量评估。
Nov, 2017
本文提出了一种使用递归神经网络 (RNN) 和注意力机制识别多人事件的模型,成功应用于新采集的篮球数据集并取得了优异的分类和检测效果。
Nov, 2015
我们提出了一个新的任务,旨在预测在佩戴式摄像机拍摄的第一人称视频中被观察者的未来位置,我们将三个关键观察结果融入到多流卷积 - 解卷积体系结构的预测框架中,实验结果表明我们的方法在我们的新数据集以及公共社交互动数据集上是有效的。
本文提出了一种基于时间序列池化的特征表示框架,用于抽象活动视频中的短期 / 长期特征描述符的变化,并用于处理第一人称视频活动数据集的动作识别问题,与基于视觉词袋和改进的 Fisher 矢量的特征表示相比能够更好地表征第一人称视频中的动作。
Dec, 2014
本文回顾了篮球比赛分析方法,关注了团队战略、个人表现以及未来趋势,重点强调需要进行因果推断。
Jul, 2020
该研究旨在研究在第一人称视角下,如何准确识别行为。为此,提出了一种新颖的特征轨迹表示方法,并且使用所提出的方法在公开数据集上实现了 11% 的性能提升,该方法可以识别出佩戴者的各种行为,且不需要分割手 / 物体或识别物体 / 手的姿态。
Apr, 2016
本文提出一种基于注意力模型、注重注视点和视觉场景分析生成视频语义得分的方法,以加速重要片段并跳过重复片段的第一人称视频片段浏览。在公开的第一人称视频数据集上进行的实验评估表明,此方法能够有效提高视频片段搜索速度和准确性。
Jun, 2020