- IJCAI使用时间图形表示对电子健康记录进行预测建模
利用深度学习的预测模型,基于电子病历(EHR),在医疗保健领域备受关注。我们提出了一种新颖的时间异构图模型,将病人的 EHR 建模成历史访问节点和医疗事件节点,并利用时间感知访问节点来捕捉患者健康状况的变化,同时通过将时间边特征、全局位置编 - 注意力作为稳健的时间序列预测表示
我们的研究表明,利用全局标记和局部窗口构建的注意力图作为数据点的稳健核表示,可以提高时间序列的预测准确性,并且在不改变核心神经网络结构的情况下,我们的方法胜过了最先进的模型,将多变量时间序列预测的均方误差 (MSE) 降低了显著的 3.6% - 局部压缩视频流学习用于通用事件边界检测
使用压缩视频表示学习方法进行事件边界检测,利用压缩域中的丰富信息,提取 P 帧特征并使用轻量级 ConvNets 和时序关系捕捉器进行特征表示精炼,最后使用简单分类器确定视频序列的事件边界。
- 无需连续吸引子的持续学习信号和工作记忆
基于我们的理论,我们为人工循环神经网络开发了一种新的初始化方案,优于需要学习时间动态的标准方法,并且提出了一种稳健的循环记忆机制,用于集成和维持方向信息而不需要环形吸引子。
- 变革心电图诊断:基于 Transformer 的深度学习模型在心血管疾病检测中的深入评估
本文阐述了 Transformer 结构在心电图分类任务中的应用,总结了最新的 Transformer 模型并探讨了其应用中的挑战和未来的改进方向,为研究人员和从业者提供了宝贵的资源,旨在为心电图识别中的创新应用提供建议。
- AAAI通过潜在时间导航进行自监督视频表示学习
本文提出了一种时间参数对比学习策略 Latent Time Navigation (LTN),以捕捉细微的运动,从而增强视频表示学习模型中时间感知特性,使模型在 fine-grained 和面向人类的任务中的分类性能得到了显著提高。同时,在 - CVPRSViTT: 稀疏视频文本 Transformer 的时间学习
通过引入边缘稀疏性和节点稀疏性的 SViTT 稀疏视频文本架构可以以较低的成本进行多帧推理,优于朴素变压器基线,并对多个视频文本检索和问答基准进行了训练,以及在更长的片段长度下是针对模型稀疏性(sparsity)进行了培训。
- 基于序列嵌入融合的流行病预测网络
本文提出了一种基于 Inter- and Intra-Series Embeddings Fusion Network (SEFNet) 的方法,该方法通过捕捉来自多个地区的时间序列之间的动态依赖关系和时间依赖关系来提高预测流行病的性能,并 - ACL条件生成有序事件序列
提出了一个 BART-based 条件生成模型,可以同时处理事件之间的时间排序和事件插入预测。使用延迟自编码器进行训练并证明了在不使用显式标签的情况下,该模型优于 BERT-based 方法和指针网络,并且在事件的时间上更优于 GPT-2 - AAAI视频对象分割的时空图神经网络基于遮罩重建
该研究提出了一种新型的时空图神经网络(STG-Net)方法,它通过利用所有 Object Proposals 并捕捉它们之间的关联来更精确地重建视频对象分割的遮罩,并通过滑动窗口方法以及记忆模型来捕捉时态相关信息。该方法在四个大型数据集上实 - CVPR清华大学人工智能联盟团队 2020 Activitynet 任务二技术报告:探索密集视频字幕的顺序事件检测
提出了一种用于密集视频字幕的事件序列生成模型,通过双向时间依赖在一次传递中生成事件边界来探索视频中的时间关系,避免了低效的两阶段提议生成,并在事件字幕模型中取得了最新的性能。
- EMNLPTORQUE: 一个包含时间序问题的阅读理解数据集
本研究介绍了 TORQUE,这是一个新的英语阅读理解基准,用于检测时间关系,结果显示 RoBERTa-large 在 TORQUE 的测试集上的精确匹配分数为 51%,约为人类表现的 30%。
- 连续视频流中的事件检测和描述
JEDDi-Net 是一种用于密集视频字幕生成的神经网络,它通过三维卷积层对输入视频流进行连续编码,并使用时间池化特征提出可变长度的时间事件,再生成它们的字幕。在大规模数据集上,JEDDi-Net 表现出了优异的性能。
- 使用时空上下文的实时在线动作检测森林
提出了一种基于随机森林的在线动作检测框架,使用计算效率高的骨骼关节特征和通用 CNN 特征,通过时间关系构造 RF 的新分割函数,并在挑战性数据集上显著提高了准确性。