提出了一种筛选流程,通过对不完整的 3D 人体姿势进行优化,解决了人体姿势估计和深度相机带来的挑战,减少了机器人的抖动,实现了更一致、无噪音的动作表达,降低了意外的机器人运动,提供更流畅的互动。
Jun, 2024
本文提出了一种全耦合的两路时空结构体系框架,可在极低分辨率(如 12x16 像素)视频中可靠地识别人的动作,以保护人们的隐私,同时在训练期间考虑高分辨率视频以建立更好的低分辨率模型,取得了明显的改进。
Jan, 2018
本文提出了一种通用的框架,利用新颖的提案方案和级联分类管道从未修剪的视频中准确检测各种活动,超越了现有最先进方法在 THUMOS14 和 ActivityNet 数据集上的表现。
Mar, 2017
本文提出了在事件域中进行时空过滤的方法,通过学习局部时空权重矩阵,增强卷积神经网络对动作识别的性能, 在 DVS Gesture 数据集和新录制的动作识别数据集上显著改善。
Mar, 2019
本文提出了一种基于时间卷积的层次结构多模态神经网络,不依赖于循环层实现对人类动作的预测,且通过多模态融合机制使得在处理具有 # egocentric videos# 意义的庞大数据集时达到了与最新研究相当的性能,但具有明显的时间优势。
Jul, 2021
本文介绍了一种基于强化学习的视频定位技术,使用文本和视频的精细特征表示来准确定位语言查询中的片段,并仅浏览整个视频的 32-41% 以节约处理时间。
Apr, 2019
移动服务机器人通过对人类行为的识别和跟踪,实现了对人类行为的理解和响应,主要依赖于人类行为识别和边缘计算处理的效果良好的模型。
Dec, 2023
该论文提出了两种基于 CNN 的体系结构,包括三种流,可以分别捕捉不同速率的空间和时间信息,并使用双向 LSTM 和注意力机制进一步提高模型性能,实现了人类动作识别任务的最先进表现。
Apr, 2021
本文研究利用深度学习,以图像流中的高级特征为基础识别佩戴式摄像机的运动,并弥补设备低帧率带来的连续帧之间的差异罅隙,从而提升了辅助技术应用中的活动识别效能。
Aug, 2017
本研究开发了一种低参数、模块化系统,具有快速推理能力,在有限数据集上完全可以进行训练,无需从大参数系统进行迁移学习。该系统能够准确检测并关联实际课堂视频中执行这些活动的学生,并开发了一个基于交互式 Web 应用程序来可视化长时间真实课堂视频中的人类活动地图。
Mar, 2024