一种基于时空注意力的学生课堂行为检测方法

Oct, 2023

一种基于时空注意力的学生课堂行为检测方法

A Spatio-Temporal Attention-Based Method for Detecting Student Classroom Behaviors

Fan Yang

TL;DR提出了一种用于检测学生课堂行为的时空注意力方法 (BDSTA)，该方法利用 SlowFast 网络生成视频的运动和环境信息特征图，然后应用时空注意力模块对特征图进行信息聚合、压缩和激励，从而获得时间、通道和空间维度上的注意力映射，并基于这些注意力映射进行多标签行为分类。实验结果表明，使用 BDSTA 相较于 SlowFast 模型，学生行为分类检测的平均准确率提高了 8.94%。

Abstract

Accurately detecting student behavior from classroom videos is beneficial for analyzing their classroom status and improving teaching efficiency. However, low accuracy in student classroom →

student behavior classroom videos behavior detection spatio-temporal attention-based method student classroom behavior datasets

发现论文，激发创造

SCB-ST-Dataset4：利用图像数据集方法扩展学生课堂场景的时空行为数据集

利用深度学习方法自动检测学生的课堂行为是分析他们的课堂表现和提高教学效果的一种有前途的方法。为了解决公开可用的学生行为时空数据集缺乏以及手动标注这类数据集的高成本问题，我们提出了一种通过图像数据集来扩展学生课堂行为数据集的方法（SCB-ST-Dataset4）。该数据集包括了 754,094 张图像和 25,670 个标签，侧重于三种行为：举手，阅读和书写。我们提出的方法可以快速生成时空行为数据集，无需进行注释。此外，我们还提出了一种行为相似度指数（BSI）来探索行为的相似性。我们使用 YOLOv5、YOLOv7、YOLOv8 和 SlowFast 算法评估了数据集，达到了 82.3% 的平均精度。实验证明了我们方法的有效性。这个数据集为学生行为检测的未来研究提供了牢固的基础，有可能推动该领域的进展。SCB-ST-Dataset4 可在此链接下载：https://URL

Oct, 2023

STA: 大规模视频人员再识别的时空注意力

本文中，我们提出了一种新的空间 - 时间注意力（STA）方法，用于解决视频中的大规模人员重新识别任务，该方法通过在时空维度上充分利用那些具有区分性的目标人物部分来生成鲁棒的剪辑级特征表示，使用该方法可以很好地解决基于视频的人员重新识别的挑战性问题，如姿势变化和部分遮挡。

Nov, 2018

CSTA：基于卷积神经网络的时空注意力视频摘要

提出了一种基于 CNN 的时空注意力（CSTA）方法，将视频的每个帧的特征堆叠起来形成类似图像的帧表示，并应用 2D CNN 对这些帧特征进行处理，实现对关键属性的学习和视觉重要性的捕捉，在 SumMe 和 TVSum 等数据集上实验证明了该方法在减少计算量的同时取得了最先进的性能。

May, 2024

时空关注的两流协同学习用于视频分类

本论文提出了一种适用于视频分类的两流协作学习方法，采用空间 - 时间注意力模型实现了针对视频中静态和动态信息的协同学习，以提取出区分度更强的特征向量，实验结果表明，该方法在各项性能指标上均优于其他 10 多种最先进的方法。

Nov, 2017

基于深度学习的时空动作检测综述

本文综述了基于深度学习的时空动作检测（STAD）的最新方法及其性能评估，讨论了相关研究的潜在方向。

Aug, 2023

基于 YOLOv7-BRA 和多模型融合的学生课堂行为检测

该研究提出了基于 YOLOv7-BRA 的学生课堂行为检测系统，通过构建 SCB 数据集并添加 biformer attention module 改进了检测精度，取得了 87.1% 的 [email protected]，并可下载使用该数据集。

May, 2023

LSTA: 面向自我中心行为识别的长短记忆关注

本文提出了一种名为 LSTA 的机制，向注意力平滑地跟踪视频序列中的动态空间相关部分的特征，有效提高了两流架构的自我中心活动识别性能，并且在四项标准测评中取得了最佳表现。

Nov, 2018

EGO4D STA 挑战赛下一个活动对象的引导关注

本技术报告提出了一种基于引导注意力机制的解决方案来解决 EGO4D 短期预测挑战，该解决方案结合了物体检测和从视频剪辑中提取的时空特征，增强了运动和上下文信息，并进一步解码物体中心和运动中心的信息以解决 EGO4D 短期对象交互预测挑战。我们在快速网络上应用引导关注力，构建我们的模型，该模型在验证集上获得了更好的性能，并在 EGO4D 短期对象交互预测挑战的测试集上取得了最佳成绩。

May, 2023

学校学生危险行为检测

本文提出了一种自动检测学生危险行为的方法，将长视频的行为识别转化为物体检测任务，结合多尺度体特征和基于关键点的姿态特征，实现了 71.0% 的平均精度（mAP）和约 11 FPS 的高效准确性。

Feb, 2022

基于改进的 YOLOv7 的学生课堂行为检测

本研究提出了基于改进的 YOLOv7 的学生课堂行为检测方法，利用 SCB 数据集（包括手举、阅读和书写三种行为），并结合 biformer attention module 和 Wise-IoU 来提高检测准确率，在 SCB-Dataset 上实验结果表明其平均精度为 79％，比以前的结果提高了 1.8％。

Jun, 2023