- IVCA: 视频复杂度互相关感知分析器
通过考虑帧间关系,我们提出了一种适用于视频流应用的关联感知视频复杂度分析器(IVCA)作为 VCA 的扩展。IVCA 通过引入特征域运动估计来提高时域特征的准确性,运用编解码器中的分层参考结构设计了层感知权重来调整不同层次的帧复杂度,并通过 - POPCat: 复杂注释任务的粒子传播
通过利用视频数据的多目标和时间特征,我们提出了一种名为 POPCat 的高效方法来创建用于分割或基于框的视频注释的半监督管道,使其在产生更大泛化能力的半监督注释的同时保持与人工注释相当的准确性。该方法通过使用粒子追踪器利用时间特征来扩展人工 - 原来我并不真实:走向强大的 AI 生成视频检测
本文提出了一种用于检测由多个最先进的生成模型合成的视频的新框架,通过 CNN + LSTM 架构从扩散模型中提取显式知识的表征,并且在域内视频上实现了 93.7% 的检测准确率,并使域外视频的准确率提高了 16 个百分点。
- 基于时间能量选择缩放和轨迹关联的小目标检测和跟踪新方法
通过利用时间特征,本文提出了一种基于时间能量选择缩放的检测方法,以及一种基于 3D Hough 变换的轨迹提取方法和轨迹基准的多目标跟踪方法,通过多个场景实验证明了这些方法的优越性。
- 使用增强型 CNN-LSTM 网络进行飞行轨迹预测
本文提出了一种增强的 CNN-LSTM 网络作为战斗机飞行轨迹预测方法,该方法从空间和时间两个维度提取特征,通过模拟实验证明相比于原始的 CNN-LSTM 方法,预测精度提高了 32% 和 34%。
- 社交媒体上的病理赌博风险预测
通过将时间特征和情感特征纳入模型,本文解决了在社交媒体数据上进行风险预测的问题,着重于对 Reddit 用户进行病态赌博障碍的分类。通过实验证明了序列模型在性能上优于基于连接的模型,提出的架构在包含 EmoBERTa 和 TD 层的情况下取 - 从脉冲流中学习稳健地重建低光动态场景
本文提出了一个双向循环基于重建框架的方法,包括一个强光鲁棒表示(LR-Rep)和融合模块,以更好地处理低光照条件下的场景重建问题。实验证明了该方法的优越性,也在真实的脉冲流中具有很好的泛化性。
- 基于 Transformer 的高时序维度解码的视频显著性预测
基于变压器的高时间维度解码网络(THTD-Net)是一种用于视频显著性预测的策略,通过对时态特征进行聚合,从而在常见基准测试中展现出与多分支和过于复杂模型相当的性能。
- D$^2$ST-Adapter:解耦与可变形的时空适配器对于少样本动作识别
此研究论文介绍了适用于少样本动作识别的新型适配器调整框架 (D^2ST-Adapter),其采用双通道架构以解耦空间和时间特征,并设计了可塑性的时空注意力模块,能够在 3D 时空视图中全局建模特征,同时保持轻量级设计。实验证明,这种方法在少 - TSViT:一种用于故障诊断的时间序列视觉变换器
传统的卷积神经网络(CNN)在捕捉时间特征(即振动信号随时间的变化)方面存在局限性,为解决这个问题,本文引入了一种新颖的模型,即时间序列视觉变换器 (TSViT),专门用于故障诊断。TSViT 模型一方面通过集成卷积层对振动信号进行分段并捕 - 超越静态图像:稳健的多流时空网络
通过多流模型,我们引入一个经过视频训练的模型,并评估其在各种图像和视频输入下的鲁棒性,特别关注时间特征在不变识别中的作用。结果表明,在训练中包含视频和时间流能够抑制图像和视频理解任务中准确性和平均准确率(mAP)下降分别约 1.36%和 3 - 医学超声视频识别中时间特征的相关性研究
我们提出了一种新颖的多头注意力结构,将时间特征排除在外以实现在常见超声任务中更好的样本效率,结果表明,对于一些低数据量的常见超声任务,表达时间无关的模型可能比最先进的视频识别模型更有效。
- ICLRT-Rep: 利用时间嵌入进行时间序列的表示学习
多变量时间序列的自我监督学习方法 T-Rep 能够学习时间序列的表示,并提取出趋势、周期性、分布变化等时间特征。在分类、预测和异常检测任务中,T-Rep 表现优于现有的自我监督学习算法,并在处理缺失数据时表现更强韧。此外,通过潜空间可视化实 - 智能制造系统中的时间序列分类:最新机器学习算法的实验评估
本研究旨在评估制造业和工业环境中时序分类任务的 SoTA ML 和 DL 算法的性能。实验表明,ResNet、DrCIF、InceptionTime 和 ARSENAL 是性能最好的算法,其在 22 个制造业时序分类数据集上的平均准确率超过 - GaitGS: 步态识别中粒度和跨度维度的时间特征学习
本论文提出了一种名为 GaitGS 的新型框架,利用多颗粒度和跨度、多个时间特征提取器和其他模块来进行步态识别,并在三个流行的数据集上进行了广泛的实验,证明了我们方法的最新性能。
- 多粒度基于时间的 Transformer 知识追踪
本文提出了一种用于预测学生标准化考试成绩的 Transformer 架构,通过学生历史数据来创建个性化模型,并采用多种时间特征进行解码以显著提高模型性能,取得了比 LightGBM 方法更好的效果,为 AI 教育领域提供了一种可扩展的准确预 - DKT-STDRL:增强空间和时间表示学习的深度知识追踪模型用于学习表现预测
本文提出了一种基于空间和时间深度表示学习的深度知识追踪模型,该模型可以在教育系统中更好地预测学生的学习表现,并且通过在多个公共教育数据集上的实验证明了其优于现有模型的预测效果。
- 音乐类型分类广播网络研究
本文探讨了基于广播的神经网络,旨在提高音乐类型分类的定位和普适性,研究了十二种不同的广播网络结构,并对块配置、池化方法、激活函数、标签平滑、通道相互依赖、LSTM 块等方面进行了讨论,使用 GTZAN、Extended Ballroom、H - MM基于深度学习的 UGC 视频无参考质量评估模型
本文提出了一种简单有效的 UGC 视频质量评估模型,通过训练端到端的空间特征提取网络直接从视频帧像素中学习感知质量的空间特征表示,并提取运动特征来度量空间特征无法建模的时间相关失真。
- 一种用于多模态无线传感器网络数据流的动态图神经网络异常检测新方法
本研究提出了一个新颖的多模态无线传感器网络数据流异常检测模型,通过三个图神经网络分别提取 WSN 数据流的时空特征和形式化特征,并结合节点的空间位置关系,从而大大提高了鲁棒性和 F1 得分。