May, 2024

基于多模式深度学习的图像识别技术研究

TL;DR利用深度神经网络研究了人类多模态行为识别算法,通过整合不同的深度神经网络对不同模态的视频信息进行适应以成功识别多个模态的行为,利用微软 Kinect 开发的多个摄像头采集传统图像并提取运动特征,将两种方法识别出的行为特征综合起来以实现行为的准确识别与分类,实验结果表明该算法在识别行为和检测视频素材中的行人行为的准确度上有显著提升。