- 自监督学习用于介入图像分析:追踪可靠的设备
通过学习超过 1600 万干预 X 光帧的数据,我们提出了一种新的方法来实现设备的准确检测和跟踪,从而提高干预心血管手术的安全性和效果,同时在干预图像分析中的其他任务中更好地理解时空语义。
- 轨迹数据管理和挖掘的深度学习:调查与拓展
本文综述了轨迹计算中深度学习的发展和最新进展,研究了深度学习在轨迹管理和挖掘方面的应用,并对目前的挑战和未来发展方向进行了概述。
- 基于轨迹和细胞命运信息的细胞身份预测
利用机器学习方法,我们提出了一种创新的方法来在早期 C. elegans 胚胎发育期间对细胞进行识别,通过利用细胞轨迹和细胞命运等少量时间空间特征,我们的模型能够在有限数据下实现 90% 以上的准确率,并能解释最重要的特征对生物知识的意义。
- 利用迁移学习和时空特征高效构建比特率阶梯
利用迁移学习和时空特征,提出了一种有效的比特率阶梯预测方法,该方法能够在保持高质量视频的同时减少编码复杂度。通过在已训练的深度神经网络中使用特征图来预测比特率 - 质量行为,并通过预测顶部质量的最小比特率来提高最高质量的效率。该方法在 10 - DA-STC: 基于时空一致性的领域自适应视频语义分割
通过引入双向多级时空融合模块和类别感知的时空特征对齐模块,提出了一种新颖的 DA-STC 方法来解决视频语义分割任务中的领域自适应问题,并在多个具有挑战性的基准测试上取得了最先进的 mIOUs。
- IJCAI在联邦学习中平衡准确性与训练时间:关于神经网络结构的暴力检测在监控视频中的研究
该研究通过使用机器学习技术来进行视频中的暴力检测,并在联邦学习环境下进行了适应性调整。通过实验使用了来自基准视频数据集中提取的时空特征,比较了不同方法,并提出了一种名为 “Diff-Gated” 的修改版本的 “Flow-Gated” 架构 - 具有 StridedPoseGraphFormer 和数据增强的鲁棒遮挡 3D 人体姿势估计
该研究提出了一种基于图卷积和 transformers 的 Spatio-temporal 3D HPE 模型,通过综合利用时空特征和合成的遮挡来处理遮挡,实验证明该方法比现有的遮挡感知方法更有效,并且在没有任何遮挡处理机制时,现有的 3D - CVPRZoom-VQA: 基于块、帧和片段的视频质量评估
本论文提出一种名为 Zoom-VQA 的视频质量评估体系架构,将视频分为三个层次并整合了三个组件(patch attention module、frame pyramid alignment 和 clip ensemble strategy - 使用卷积关注(ConvEntion)进行天文图像时间序列分类
本文提出了一种基于深度学习的新方法 ConvEntion,它利用天文图像时间序列中的时空特征对不同类型的天文空间物体进行直接分类,相较于其他基于图像时间序列及光度曲线的方法,该方法取得了 13% 至 12% 的准确率提升。
- 基于胶囊网络的光流估计 CapsFlow
本文提出了使用胶囊网络处理光流问题的框架,并展示了在小型数据集上胶囊网络的表现优于 FlowNetC 和 PWC-Net 等模型的结果。
- 动作识别中的 Transformer: 时序模型综述
本文主要介绍了基于 transformers 模型的深度学习方法,用于模拟时间上的变化进行动作识别的研究进展和应用挑战。
- STAR-Transformer:面向人类动作识别的时空交叉注意力变压器
提出一种名为 STAR-transformer 的模型,该模型可以有效地表示两个跨模态特征为可识别的矢量,并学习到一种高效的多功能特征表示方法。在动作识别领域中,STAR-transformer 的效果显著优于之前的最先进方法。
- 基于时空趋势推理的人体姿态和形状估计技术
本文提出了一个 SRT 网络,通过时空趋势推理设计了一个时间趋势推理(TTR)模块和一个空间趋势增强(STE)模块,来提高人体姿态估计的准确性。通过实验在公共数据集上验证,该模型与同类算法性能相当。
- 简单和复杂的尖峰神经元:在简单 STDP 场景下的观点和分析
本研究比较了三种简单的脉冲神经元模型 (简洁型、二次型和指数型),利用 Spike-Timing Dependent Plasticity (STDP) 在 N-MNIST 和 DVS Gestures 数据集上测试它们的分类表现,结果显示 - AAAI时空循环神经网络用于基于事件的光流估计
本文提出了一种新颖的输入表示法,捕捉事件的时间分布以增强信号,并介绍了一种利用卷积门控循环单元从一系列事件图像中提取特征图的时空循环编码 - 解码神经网络体系结构,其中允许整合一些基于帧的核心模块,如相关层和迭代残差精化方案,它在 Mult - CVPR长视频中通用事件边界识别
本文提出了一种基于两个流充气 3D 卷积体系结构的通用事件边界检测技术,可以从视频中学习时空特征,从而实现在视频理解方面的重大进展。
- 利用特征融合和时空注意力预测行人过路意图
该研究提出一种采用注意力机制和递归神经网络融合序列 RGB 影像、语义分割掩码和自车速度的神经网络结构,用于预测行人过马路意图,从而解决全局时空上下文与融合传感器数据的最优策略问题,实现了针对自动驾驶系统中行人行为预测的最优性能。
- 视频去雨的增强时空交互学习:更快更好的框架
本文提出了一种新的端到端视频去雨水框架 ——Enhanced Spatio-Temporal Interaction Network(ESTINet), 使用深度残差网络和卷积长短时记忆,可以在计算资源开销极小的情况下捕捉连续帧之间的空间特 - 基于时空特征的深度伪造视频普适检测
通过使用 3D CNN 建立时空特征提取模型,我们提出了一种新的深度伪造视频检测方法,相比于现有方法能更准确地进行分类,并且经过测试表现出更强的通用能力。
- 为视频物体分割提出三维卷积的论点
本文提出了一种基于 3D 全卷积神经网络的编码 - 解码网络结构,将其应用于视频中的显著对象分割。尝试使用全 3D 卷积来处理外观和运动信息从而实现密集视频预测,并通过 3D 全局卷积层和 3D 细化模块进行编码和解码操作。作者将其应用于