基于面部特征点和时空图卷积网络的参与度测量
本文通过构建几何二流图网络、自学习机制和自适应动作单元损失函数,研究了人脸标志物对微表情识别的贡献。实验证明,本文提出的方法具有更高的效率和更低的计算成本,且人脸标志物对微表情识别有重要贡献,值得进一步研究高效的微表情分析。
May, 2022
使用从逼真的新闻视频中提取的面部地标的情感识别的一种新方法,采用图神经网络分析面部地标的几何和空间关系,提高情感识别的理解和准确性。该方法通过构建基准数据集展示了其可行性和潜力,为情感识别技术的未来研究指明了新的方向。
Apr, 2024
我们提出了一种新的通过学生动作识别来衡量行为参与度的技术。该方法通过识别学生的动作来预测学生的行为参与水平,并利用 3D 卷积神经网络模型对学生上身动作进行建模和识别。通过构建动作的直方图并使用 SVM 分类器来判断学生是否参与,实验证明学生动作可以达到 83.63% 的准确率,并且该方法能够捕捉到班级的平均参与度。
Jul, 2023
本文提出了一种用于面部表情识别的多尺度时空图卷积网络 (SpoT-GCN),通过接受域自适应滑窗策略提取更稳健的动态特征,并通过面部图形表示将微妙的动态特征转换为学习到的时空图模式,并使用提出的面部局部图池化 (FLGP) 从多个尺度的面部图结构中学习局部和全局特征,此外,引入了有监督对比学习来增强模型对难以分类的帧的区分能力。在 SAMM-LV 和 CAS (ME)^2 数据集上的实验结果表明,我们的方法在微表情识别方面达到了最先进的性能,消融研究进一步验证了我们提出的模块的有效性。
Mar, 2024
该论文介绍了一种基于几何的方法来解决现有的真实时间凝视估计系统所面临的挑战,利用普通消费级硬件生成准确、稳定的人脸和虹膜的三维地标,从而预测眼睛凝视方向,实现低计算资源要求下的高精度、实时的眼睛凝视估计。
Dec, 2023
本文提出了一种新的深度图形学习方法来进行精准的解剖面和医学(如手、骨盆)标志物检测,该方法结合了局部图像特征和全局形状特征,基于两个图卷积网络(GCNs)学习任务特定的结构。该方法在公共人脸图像数据集和 X 射线医学数据集上的实验结果表明,在鲁棒性和准确性方面的表现都优于先前的最新方法。学习到的图形拓扑的质量可视化证明了标志物背后物理上合理的连接。
Apr, 2020
使用深度学习技术和面部表情来评估学生在在线学习课程中的参与程度,通过结合基本情绪表达出困惑、满意、失望和挫败等四种复杂情绪来动态描绘学生情绪,并通过卷积神经网络模型实现对学生情绪的准确分类,准确率达到 95%。
Nov, 2023
通过使用 CNN 和 LSTM 网络,我们提出了一种新的回归模型,能够从标准视频流中计算出机器人与人类互动过程中的单一测量值,以衡量参与度,并在不同环境下成功应用。
Jan, 2020
考虑到学习者参与可以对学习者和教师带来共同的利益,本文提出了一个通用的轻量级模型,以选择和处理特征来检测学习者的参与度,同时保留随时间变化的顺序时序关系。通过分析公开可用的 DAiSEE 数据集中的视频,该模型能够捕捉学习者参与度的动态本质。此外,本文提出了一个适应策略,以通过利用与教育相关的数据集的情感状态来找到新的标签,从而提高模型的判断能力。该模型在特定实现中取得了 68.57%的准确率,并且优于研究中研究了的用于检测学习者参与度水平的最先进模型。
May, 2024
地理空间活动与土地利用类型之间存在相关性。提出一种新颖的自监督方法,基于运动活动时间序列对景观进行分层。时间序列信号首先转换到频域,然后通过压缩自编码器转换为与任务无关的时间嵌入,该方法保留了时间序列中观察到的循环时间模式。通过深度语义分割,将像素级嵌入转换为类似图像的通道,可用于基于任务的异模态建模和下游地理空间任务的建模。实验证明,时间嵌入是时间序列数据的语义有意义的表示方法,并且在不同的任务中如分类住宅区和商业区等有着良好的效果。时间嵌入将时空运动轨迹数据转换为语义有意义的类似图像的张量表示,可以与其他数据模态(如 RBG 图像、道路网络的图嵌入、被动采集的 SAR 图像等)相结合进行多模态学习,从而促进地理空间计算机视觉中的多模态学习。多模态计算机视觉对于训练地理空间特征检测的机器学习模型以保持地理空间映射服务实时更新是至关重要的,可以显著提高用户体验和用户安全。
Oct, 2023