用於減少人機交互的高效多頻段時間視頻過濾器

Mar, 2024

用於減少人機交互的高效多頻段時間視頻過濾器

Efficient Multi-Band Temporal Video Filter for Reducing Human-Robot Interaction

Lawrence O'Gorman

TL;DR移动机器人通过基于时间的过滤方法提高路径完成效率，并通过基础设施摄像头捕获人类活动来选择高效的时间和路线，从而实现全局路径规划和本地导航。

Abstract

Although mobile robots have on-board sensors to perform navigation, their efficiency in completing paths can be enhanced by planning to avoid human interaction. infrastructure cameras can capture human activity c

mobile robots human interaction infrastructure cameras temporal filtering method global path planning

发现论文，激发创造

人机交互场景中基于无标记多人跟踪的鲁棒滤波器

提出了一种筛选流程，通过对不完整的 3D 人体姿势进行优化，解决了人体姿势估计和深度相机带来的挑战，减少了机器人的抖动，实现了更一致、无噪音的动作表达，降低了意外的机器人运动，提供更流畅的互动。

Jun, 2024

极低分辨率动作识别的全耦合双流时空网络

本文提出了一种全耦合的两路时空结构体系框架，可在极低分辨率（如 12x16 像素）视频中可靠地识别人的动作，以保护人们的隐私，同时在训练期间考虑高分辨率视频以建立更好的低分辨率模型，取得了明显的改进。

Jan, 2018

追求时间准确性的通用活动检测

本文提出了一种通用的框架，利用新颖的提案方案和级联分类管道从未修剪的视频中准确检测各种活动，超越了现有最先进方法在 THUMOS14 和 ActivityNet 数据集上的表现。

Mar, 2017

基于时空滤波的事件驱动行为识别

本文提出了在事件域中进行时空过滤的方法，通过学习局部时空权重矩阵，增强卷积神经网络对动作识别的性能，在 DVS Gesture 数据集和新录制的动作识别数据集上显著改善。

Mar, 2019

多模态时间卷积网络在自我中心视频中预测动作

本文提出了一种基于时间卷积的层次结构多模态神经网络，不依赖于循环层实现对人类动作的预测，且通过多模态融合机制使得在处理具有 # egocentric videos# 意义的庞大数据集时达到了与最新研究相当的性能，但具有明显的时间优势。

Jul, 2021

穿越时间：视频活动的有效定位

本文介绍了一种基于强化学习的视频定位技术，使用文本和视频的精细特征表示来准确定位语言查询中的片段，并仅浏览整个视频的 32-41% 以节约处理时间。

Apr, 2019

从检测到动作识别：面向机器人人体感知的基于边缘的流程

移动服务机器人通过对人类行为的识别和跟踪，实现了对人类行为的理解和响应，主要依赖于人类行为识别和边缘计算处理的效果良好的模型。

Dec, 2023

三流网络用于增强动作识别

该论文提出了两种基于 CNN 的体系结构，包括三种流，可以分别捕捉不同速率的空间和时间信息，并使用双向 LSTM 和注意力机制进一步提高模型性能，实现了人类动作识别任务的最先进表现。

Apr, 2021

基于批处理的自拍照流活动识别

本文研究利用深度学习，以图像流中的高级特征为基础识别佩戴式摄像机的运动，并弥补设备低帧率带来的连续帧之间的差异罅隙，从而提升了辅助技术应用中的活动识别效能。

Aug, 2017

协作学习环境中的快速低参数视频活动定位

本研究开发了一种低参数、模块化系统，具有快速推理能力，在有限数据集上完全可以进行训练，无需从大参数系统进行迁移学习。该系统能够准确检测并关联实际课堂视频中执行这些活动的学生，并开发了一个基于交互式 Web 应用程序来可视化长时间真实课堂视频中的人类活动地图。

Mar, 2024