- 多阶段对比回归用于动作质量评估
近年来,视频行为质量评估(AQA)受到越来越多的关注。大多数现有方法通常通过考虑整个视频来解决 AQA 问题,却忽视了行为的内在阶段级别特征。为了解决这个问题,我们设计了一种新的多阶段对比回归(MCoRe)框架来处理 AQA 任务。此方法可 - STF:空间时间融合的轨迹预测
本研究提出了一种集成的三维图形方法,将空间和时间信息融合在一起,并考虑跨时间的交互信息,以更准确地预测车辆轨迹。实验证明,该方法在长时间范围的轨迹预测中表现优于其他基线方法。
- 基于图形的移动建模研究:用于下一个兴趣点推荐的图形转换模型
MobGT 是一种基于图神经网络和移动性图转换器的算法,能够全面利用图来捕捉用户移动模式中的空间和时间特征,并通过引入针对空间 - 时间数据的新型损失函数解决了长尾问题。
- 时空车辆重识别
基于自适应 Parzen 窗方法和融合网络的空时域车辆重新识别框架在公共数据集(VeRi776)上取得 99.64% 的 rank-1 准确率,实验证明利用空时信息可以提高基于外观的方法的准确性并有效处理外观歧义。
- 基于长序列行为的新型时空建模方法:碎片化与整合网络 (FIN) 用于在线订餐点击率预测
基于时空信息的在线位置服务对于点击率预测任务具有重要意义,尤其是在主流的美团、饿了么等在线订餐平台中。本文通过设计一种名为 “Fragment and Integrate Network(FIN)” 的新型时空建模范式,解决了现有方法在表示 - 动态场景图生成的本地 - 全局信息交互解偏差
提出了一种基于多任务学习的新型动态场景图生成模型,该模型结合了局部交互信息和全局人物行为交互信息,通过对象和帧特征之间的交互使模型更全面地理解单幅图像的视觉环境,并使用长时人体动作监督模型生成符合全局约束条件且避免不能学习尾谓词的多个场景图 - 利用时空背景对单目 RGB 视频中的互动手部重建进行开发
利用时空信息重建交互手部的新框架,结合时序上下文与运动平滑性的时间约束,并采用物理碰撞检测模块以实现运动可信的交互手部重建。
- 交通中轨迹预测的快速无地图模型
该研究提出了一种高效的轨迹预测模型,不依赖于交通地图,通过在两个阶段中综合应用注意机制、LSTM、图卷积网络和时间变换器等技术,编码了单一代理的时空信息,并探索了多个代理之间的时空交互信息,实现了比现有无地图方法更高的性能,并超过了 Arg - 用于抗菌素敏感性模式预测的时空网络
本文提出了一种基于时空信息的新型抗生素敏感试验模式预测框架 STAPP,能够有效地利用模式相关性和时空信息对抗生素敏感试验模式进行预测,并且在真实数据集上的实验结果表明其优越性。
- CVPR通过时空数据过度拟合实现高质量、高效的视频超分辨率
利用深度卷积神经网络,结合时空信息,通过数据导向联合训练技术,实现高质量高效实时的视频超分辨率提升,相比现有技术在流媒体视频分辨率提升任务中提高了 14 倍帧率同时提高 2.29dB 的画质。
- 基于生成模型的时间序列异常检测
本研究提出了一种基于数据驱动生成方法的交通拥堵异常检测框架,通过对多变量时间序列的分布进行学习,结合空间 - 时间信息进行聚类和核密度估计,能够在无监督和稀疏的环境下实现交通异常的检测和分类,并在合成数据集上得到了显著的性能提升。
- DynSTGAT:动态时空图注意力网络用于交通信号控制
本论文提出了一种名为 DynSTGAT 的神经网络框架,该框架结合了动态历史状态和新的时空图注意力网络,旨在解决现有方法未充分利用空间 - 时间关联性的问题,提高交通信号控制的性能。
- ICCV学习人物再识别的实例级时空模式
本文提出了一种新的个性化、时空解耦的人员再识别方法(InSTD), 其中加入了个性化信息用于狭窄化搜索空间并将空间 - 时间传递概率从联合分布解耦以适应离群值,实验结果表明,我们的方法在 Market-1501 和 DukeMTMC-reI - CVPR通过图神经网络学习动态的人体姿态估计与跟踪
本文提出了一种基于图神经网络 (GNN) 的在线学习姿态动态的新方法,通过纳入时空和视觉信息,匹配历史姿态 tracklets 并直接预测下一帧的目标姿态,通过综合检测到的姿态和预测,实现多人姿态估计和跟踪。实验结果表明,该方法在人体姿态估 - TSSRGCN: 用于交通流量预测的时间 - 频谱 - 空间检索图卷积网络
该论文提出了一种基于神经网络模型的交通流预测方法,该方法可以提取交通流数据的空间和时间信息,进而通过结合两种图卷积网络方法来学习节点和边的表示,并利用基于周期的膨胀可变卷积模块来准确捕获每个节点上不同的时变趋势,实验结果表明该模型可以更好地 - 基于局部约束的空间变形网络用于视频人群计数
本研究提出一种基于密度图和局部限制空间变换网络(LSTN)的视频人群计数方法,旨在解决人员在场景中移动等因素引起的密度图变化问题,并通过收集包含 15K 帧的大规模视频人群计数数据集来验证该方法的有效性。
- 基于 LSTM 和 CNN 的骨架动作识别
该研究使用 3D 骨架数据和卷积神经网络 (CNN) 和长短期记忆 (LSTM) 方法进行 3D 人体行为分析,证明 CNN 和 LSTM 的分数融合方法可以更有效地捕获空间 - 时间信息,并在 NTU RGB+D 数据集上取得了最先进的结 - 基于骨骼的动作识别的双流三维卷积神经网络
本文利用 3D CNN 提取基于骨架的动作识别的时空信息与深度特征,探讨其与 RNN 的互补性和噪声下的鲁棒性,并在 SmartHome 数据集和 NTU RGB-D 数据集上获得优异的表现。
- 基于卷积神经网络的大规模孤立手势识别
该论文提出了三种简单、紧凑而又有效的深度序列表示方法,分别称为动态深度图像 (DDI)、动态深度法线图像 (DDNI) 和动态深度运动法线图像 (DDMNI)。这些动态图像是从一系列深度图像构建而成的,使用双向排名池化来有效地捕捉时空信息,