该研究开发了一种混合动态 - 静态上下文感知关注网络(ACTION-NET), 以供评估运动视频的动作质量,并提出了一个上下文感知关注模块,可以提取更加强健的流特征,其中静态特征代表特定时刻的动作质量。此外,研究者收集和注释了新的韵律体操数据集,以供评估长视频的动作质量评估。
Aug, 2020
本研究基于体操比赛视频开发了 FineGym 数据集,提供了具有三层语义层次的动作和子动作的时间标注,挑战了运动分析中的行为识别和区分问题。
Apr, 2020
本研究使用三种基于神经网络模型的框架 (SVR, LSTM, LSTM+SVR) 对奥林匹克运动会项目(跳水、跳马和花样滑冰)的比赛评价进行实验。实验结果表明,三种框架均显著优于现有的比赛质量评估方法,其中基于 SVR 的框架取得最好的效果,而基于 LSTM 的框架则更符合动作的描述和改进反馈。
Nov, 2016
提出了一个多模态和多任务的花样滑冰数据集(MMFS),其中包含了动作识别和动作质量评估,收集了来自世界花样滑冰锦标赛的 11671 个视频片段,包含 256 个类别,包括空间和时间标签。
Jul, 2023
本研究采用弱监督和跨领域转移学习的方法,结合深度卷积神经网络和长短时记忆网络,实现从未剪辑的网络视频中,对于精细的动作定位识别,并使用大量的数据集如 FGA-240 和 THUMOS 2014,得到了令人信服的结果。
Apr, 2015
本文提出一种名为 “grouped spatial-temporal aggregation” 的新型分解方法,将特征通道分解成空间和时间分组并在并行处理。实验证明,该方法在需要时序推理的动作识别任务上具有更加高效的性能。
Sep, 2019
构建了一个名为 LOGO 的多人长视频数据集,含有 8 名运动员的 200 个视频,用于行动质量评估。通过引入组信息和详细的动作过程注释,提出了一个简单而有效的方法来建模运动员之间的关系以及长视频中的潜在时序逻辑。系统地对几种常用的 AQA 方法和行动分割方法在 LOGO 数据集上的表现进行了评估,并展示了我们的方法达到了最先进的效果。
Apr, 2024
本文提出了一种灵活的多粒度时间聚合框架,用简单的技术如最大池化和注意力实现了最新的下一步行动和密集预测,并在 Breakfast,50Salads 和 EPIC-Kitchens 数据集上取得了最新的实验结果,且兼容于视频分割和动作识别。
Jun, 2020
本文提出利用时态梯度提升多模态特征提取以改善在少量标记数据情况下的半监督视频动作识别,方法在多个半监督设置中均取得了最先进的结果。
Nov, 2021
该研究提出了一种无参考视频质量评估方法,通过学习空间 - 时间域内的有效特征表示,结合高斯分布约束和金字塔时间聚合模块等方法,达到跨内容、分辨率和帧率的高泛化能力。实验表明,该方法在跨数据集设置方面优于现有方法,在内部数据集配置方面的性能相当,展示了该方法的高泛化能力。
Dec, 2020