- 等变时空关注图网络模拟物理动力学
学习表示和模拟物理系统的动力学是一个关键且具有挑战性的任务。在这篇论文中,我们将动力学模拟重新定义为时空预测任务,通过利用过去时期的轨迹来恢复非马尔科夫相互作用。我们提出了 ESTAG(等变时空注意力图网络),这是一种时空 GNN 的等变版 - LiDAR 目标检测的等变时空自监督
基于空间和时间增强的等变学习框架,通过鼓励平移、缩放、翻转、旋转和场景流的等变性,提高了三维物体检测的性能。
- 机器学习和物联网在户外空气污染监测和预测中的应用:一项系统文献综述
该研究回顾了使用机器学习和物联网(IoT)进行室外空气污染预测以及监测传感器和输入特征的组合的应用,发现了预测的三种方法:时间序列、基于特征和时空。该回顾还提出了未来研究的方向,并强调了在医疗保健、城市规划、全球协同和智能城市方面的实际意义 - Video-GroundingDINO: 面向开放词汇的时空视频定位
该研究论文介绍了一种开放式语义和语境视频定位模型,通过使用预训练的空间定位模型,克服了固定词汇和有限训练数据的限制,取得了在闭合式和开放式语境下的卓越性能。
- Earthfarseer:一种多功能的时空动力系统建模方法
通过结合本地卷积和全局基于傅立叶变换的 Transformer 架构,EarthFarseer 提出了一个简洁的框架,以动态捕捉本地 - 全局空间交互和依赖关系,并通过多尺度全卷积和傅立叶架构高效地捕捉时间演化。在八个人类社会物理和自然物理 - FourierHandFlow:使用傅里叶查询流的神经 4D 手表示
FourierHandFlow 是第一个从 RGB 视频中学习的神经 4D 连续手部表示,其将 3D 占据场与表示为傅里叶级数的关节感知查询流相结合,以保证平滑和连续的时间形状动态,并在运动内插 / 外插和纹理转移方面取得了先进的结果。
- 基于 Newell 理论的特征变换在时空交通预测中的应用
通过交通流量物理特征转化提高深度学习模型的可迁移性和预测性能,实验结果表明该方法可成功应用于不同的交通数据集和位置
- 如何利用时空上下文丰富日前太阳辐照预测
本文采用深度学习,设计了一个利用卫星数据的时空上下文来高精度预测全球水平辐照度(GHI)的天际时间序列预测模型,并提出了一种预测不确定性分布的方法。作者通过将特别困难的日子(在这项研究中特别是经历变化多端的多云天)与简单的日子分开来评估模型 - LOGO-Former: 动态面部表情识别中的局部 - 全局时空变换器
提出了一种名为 LOGO-Former 的本地全局时空 Transformer,用于解决人脸表情识别中长期依赖问题,将本地和全局特征结合起来,在两个野外人脸表情数据集上取得了有效的识别性能。
- AAAIAirFormer: 利用 Transformers 预测中国全国空气质量
本文介绍了一种新的 Transformer 架构 AirFormer,用于预测中国全国范围内空气质量,具有前所未有的千亿级细粒度,包括两个新的自我注意机制来高效学习时空表示,并使用潜在变量来捕捉空气质量数据的固有不确定性。我们使用中国大陆 - Tensor4D:高保真动态重建和渲染的高效神经 4D 分解
Tensor4D 是一种高效而有效的动态场景建模方法,通过 4D 张量分解来直接表示动态场景,并通过不同尺度上的分解进一步实现动态构建和渲染。在合成和现实世界场景中验证了其效果,具有高质量的动态重建和渲染功能。
- 使用图网络和新型 Transformer 架构进行时空风速预测
本研究使用图神经网络和不同的 Transformer 架构,探讨风速预测的时空依赖性,提出了 Fast Fourier Transformer 和 Autoformer 架构,使用这些架构的模型在时空预测上的表现优于其他模型。
- ECCV视频目标分割中对抗背景干扰
本文提出了三种新策略来抑制背景干扰器的出现,并使用一种新的半监督视频物体分割技术,使得所提出的模型在公共基准数据集上具有与现有技术方法可比拟的性能表现,同时还能够实现实时性能。
- 盲文字体识别:神经形态硬件时空模式识别基准测试
基于 iCub 机器人指尖电容触觉传感器记录了布莱叶盲文字母数据集,以比较前馈和循环脉冲神经网络在 Intel Loihi 神经形态芯片上进行的快速和有效推理,并通过使用代理梯度的 BPTT 进行离线训练和比较,结果表明循环脉冲神经网络在基 - BEVerse: 基于鸟瞰视角的统一感知和预测,用于以视觉为中心的自动驾驶
该研究提出了基于多相机系统的统一三维感知和预测框架 BEVerse,通过对多相机视频生成空间 - 时间鸟瞰(BEV)表示,并同时推理多个自动驾驶视觉任务,通过在 nuScenes 数据集上的实验表明,与现有的单任务方法相比,多任务 BEVe - AAAI视频表示学习的频率选择性增强
本文提出了一种基于频域的时空数据增强方法,称为 FreqAug,可以在吸收视频信息的过程中减少对静态信息的偏好,以更好地学习视频表示,并在五个视频动作识别和两个时间动作定位下游任务上表现出一致的改进。
- 学习时空下采样以实现有效的视频提升
本文提出了一个神经网络框架,该框架能够联合学习时空下采样和上采样,并提出了两个新模块以解决时空去混叠问题和提高重建性能。实验证明,该方法显著提高了时空重构质量,并且能够应用于任意视频重采样、模糊帧重建和高效视频存储。
- 基于位移切块的时空表示学习变压器
本研究针对视频分类问题, 提出了一种基于 Transformer 与自注意力机制的空时表示学习方法,其中采用 shifted chunk Transformer 对视频帧间数据进行建模,通过局部到全局的多层次学习,构建了视频片段编码器,加强 - IJCAI监控视频中基于弱监督的时空异常检测
本文提出了一种被称为弱监督时空异常检测的新任务,针对监控视频的异常情况进行定位。我们提出了一种双分支网络方法,能够在时空域中使用多粒度的 proposals 进行关系推理,以捕捉目标行为的丰富上下文信息和复杂实体关系。并且在两个数据集上进行 - ICML具有缺失数据的时空观测数据的共形异常检测
本研究提出了一种分布自由、非监督异常检测方法 ECAD,该方法基于符合性预测,不需要数据交换性但在数据正常时大约控制了第一类错误。这种方法计算上不涉及数据分割,通过训练集成预测器以提高统计能力。我们展示了 ECAD 在检测异常时的优越性能,