- PolypNextLSTM:一种使用 ConvNext 和 ConvLSTM 的轻量级快速息肉视频分割网络
用于息肉分割中,PolypNextLSTM 利用视频数据的时间洞察力,采用基于视频的深度学习方法,通过有效利用时间信息来获得出色的分割性能,参数最少且速度最快,胜过五个最先进的基于图像和视频的深度学习模型。
- 卷积状态空间模型用于长程时空建模
ConvSSMs combine ConvLSTM and state space methods to efficiently model long spatiotemporal sequences, outperforming Tran - 物理信息卷积循环代理模型在考虑井控制的储层模拟中的应用
本文提出了一种新颖的代理模型 -- 物理知识卷积递归神经网络(PICRNN),用于建模具有井控制的井下流体流动。
- 使用深度神经网络进行降水现在预报
本研究使用三种深度学习模型(U-net、ConvLSTM 和 SVG-LP)在二维降水图上进行降雨即时预测,并提出了补丁提取算法以获得高分辨率的降水地图和损失函数来解决图像模糊问题和减少降水地图中零值像素的影响。
- 一种拓扑注意力 ConvLSTM 网络及其在 EM 图像中的应用
本文提出了一种新的形态拓扑注意力图卷积长短记忆网络(TACNet)用于生物医学图像的三维分割,其中采用了 ConvLSTM 和迭代形态拓扑注意(ITA)模块,对于三维分割任务可以实现高的结构准确性和更稳定的关键拓扑图,定量定性结果表明该方法 - ConvTransformer: 用于视频帧合成的卷积变换器网络
本文提出了一种名为 ConvTransformer 的深层卷积神经网络结构,通过注意力机制学习序列数据之间的依赖关系,用于视频帧合成,相较于传统的卷积 LSTM 方法可实现更好的并行计算效果。
- ECCV智能:多智能体联合递归轨迹预测
本文提出了一种解决多模态数据和场景下多主体交互的轨迹预测问题的方法,使用 convLSTM 结合 CVAE 进行多样性预测,通过多元化的数据集模拟,取得了比现有方法更好的效果
- CVPR通过序列特征金字塔网络实现马赛克超分辨率
本文提出了一种基于深度学习超分辨率的方法,利用卷积 LSTM 和注意机制来提高既可以用于 RGB Bayer 也可以用于多光谱的马赛克图像的空间和光谱分辨率,实验结果表明该方法在既可以用于 Bayer 也可以用于多光谱图像上均优于当前最先进 - CVPR快速准确的一阶空时视频超分辨率:缩放慢动作
本文提出了一个一阶段时空视频超分辨率框架,该框架通过特征时间插值网络进行局部时间上下文的丢失 LR 视频帧,然后提出了一个可变形 ConvLSTM 来对齐和聚合全局时空信息,并最终采用深度重建网络预测 HR 慢动作视频帧。经实验证明,该方法 - 不要忘记过去:从单目视频中的循环深度估计
本文介绍了一种基于 ConvLSTM 和三种不同类型深度预测网络的自监督实时单目深度估计和完成方法,能够产生一系列的深度图,该方法灵活且可与不同类型稀疏深度图案件组合使用,实验表明,我们的方法在自监督场景中始终优于其基于图像的对应方法,并且 - ICCV非局部 ConvLSTM 用于视频压缩伪影降噪
本文提出了一种基于 ConvLSTM 的深度神经网络,称为非局部 ConvLSTM,以解决通过利用多个连续帧来降低视频压缩失真的问题,并在两个数据集上验证了其性能优于现有方法。
- 基于以智能体为中心的时空栅格的场景合规轨迹预测
使用基于网格表示的模型,结合卷积神经网络及 ConvLSTM 解码器,针对人体运动预测中存在的非线性、多模态和不确定性等问题提出了一种解决方案,取得了优于现有方法的效果和真实性。
- 使用卷积 VRNN 进行未来帧预测的异常检测
本研究提出了一种基于生成模型和 ConvLSTM 的新型顺序生成模型,用于预测未来视频帧,并在异常检测框架中考虑时间信息,实验表明,该方法在三个基准数据集上优于现有最先进方法。
- 多粒度时空建模用于唇读
本文提出了一种基于多级时空建模法的新型唇读模型,采用细粒度和中等粒度特征提取方法,结合时域注意理解整个输入序列,该模型在挑战的单词级唇读基准测试中表现出良好的效果。
- 一种端到端的视频文本检测器,具备在线跟踪功能
本文介绍一种基于 ConvLSTM 和在线跟踪的视频文本检测方法,将检测和跟踪的两个任务结合起来,提高了检测精度,降低了计算成本,并且实验表明该方法在 ICDAR2013 Video、Minetto 和 YVT 等数据集上均有极大的优势。
- 视频显著性预测的简单与复杂时间循环
本文探讨了利用两种类型的循环神经网络来改进现有的神经网络架构,以进行静态显著性预测。第一种修改是在架构内添加 ConvLSTM,而第二种修改是卷积状态的指数移动平均。实验结果在 SALICON 数据集上进行了权重预训练,并在 DHF1K 上 - FACLSTM: 用于场景文本识别的具有聚焦注意力的 ConvLSTM
本研究提出了一种基于 ConvLSTM 的场景文本识别器,名为 FACLSTM,该识别器充分利用像素的空间关联和注意机制,通过卷积操作和生成字符中心掩码来帮助聚焦关注正确的特征区域,并在基准数据集 IIIT5K、SVT 和 CUTE 上得到 - 空间时间卷积 LSTM 用于通过学习 4D 纵向病人数据预测肿瘤生长
通过 ConvLSTM 技术,结合静态图像和时间动态变化,从多个患者研究中提取 3D 和时间维度信息来预测肿瘤体积,同时可实现肿瘤细胞密度和 CT 强度值的预测,并应用于 4D 医学图像分割任务。
- 用于腹腔镜视频中工具跟踪的弱监督卷积 LSTM 方法
本文介绍了一种仅使用二分类标记来训练内窥镜视频工具跟踪器的方法,这种方法利用了连续图像帧的时空一致性,基于 ConvLSTM 对工具的存在检测、空间定位和运动跟踪进行了改进。
- 基于卷积 LSTM 的未来语义分割
本文提出了一种新的模型,使用 ConvLSTM 编码观察到的视频帧的时空信息来预测未观察到的未来帧的语义分割图,并扩展了双向 ConvLSTM 来捕获双向的时间信息,该方法在基准数据集上优于其他最先进的方法,为实时决策制定提供了可靠的解决方