- WWW一款探测器,称霸所有:通向通用深度伪装攻击检测框架
通过引入卷积 LSTM 残差网络(CLRNet)并探索深度伪造(DeepFake)中的时空信息,我们提出了一种更通用的方法来检测由多种方法产生的深度伪造,包括 DeepFake-in-the-Wild(DFW),此方法在多个基准数据集上表现 - 深度视频修复检测
该研究探讨了视频修补检测技术,提出了一种双流编码器解码器体系结构和注意力模块的 VIDNet 方法,该模型采用误差级别分析数据增强处理 RGB 帧,进一步利用卷积 LSTM 模型对编码得到的多模态特征进行空间和时间关系的探索,并使用四个方向 - 基于卷积 LSTM 残差网络的深伪造视频检测
本文提出了一种基于卷积 LSTM 的深度学习模型(CLRNet),利用序列帧输入方法检测深伪视频中图像间的不自然痕迹,并且使用迁移学习对不同类型深伪视频的识别进行泛化。在 FaceForensics++ 数据集上进行了实验,结果显示我们的模 - ECCV通过自我监督长期建模学习单目视觉里程计
自监督学习 VO 的一种特殊考虑一致性的方法,采用具有两层卷积 LSTM 模块的姿态网络对姿态预测中的长期依赖进行建模,通过自监督损失进行训练,包括模拟几何 VO 中的循环一致性丢失的循环一致性丢失,并通过引入一种损失使网络能够在训练期间超 - CVPR反馈 U-net 用于细胞图像分割
该研究提出了使用卷积 LSTM 来进行分割的反馈 U-Net 方法,通过将输出反馈到输入并提取特征来优化分割过程,结果在果蝇和老鼠细胞图像数据集中优于传统的前馈 U-Net 方法。
- 卷积张量列车长短时记忆网络用于时空学习
本文提出了一种高阶卷积 LSTM 模型和一种新的张量列车模块,可以有效地学习视频序列中的长期时空相关性,并通过结合时间上的卷积特征进行预测,通过张量列车分解降低了模型复杂度,取得了广泛应用和数据集上的最佳表现。
- 压缩卷积 LSTM:一种高效的深度学习框架,用于模拟高保真度的三维湍流
提出了一种新的训练方法,用于减少维数和建模三维湍流的时空动力学,利用卷积自编码器和卷积 LSTM 神经网络组合,通过严格的基于物理的统计测试评估了湍流场的质量,并表明这种训练方法在计算资源开销的小部分情况下,生成了具有物理一致性的湍流场。
- CVPR基于版面的图像生成
Layout2Im 是一种基于布局的图像生成方法,将物体表示分解为指定和不确定部分,并使用卷积 LSTM 编码并解码整个布局,以生成准确且多样化的图像,提高了最佳 Inception 分数 24.66%至 28.57%。
- 可解释的时空注意力视频动作识别
通过引入可解释的时空注意力机制来提高视频动作识别的准确性和模型解释性,并使用一组正则化器对其进行约束。利用弱监督的方式仅使用分类标签,模型不仅提高了准确性,还能时空自动定位区分性区域。
- 只需注意力:将物体中心注意力固定在自我中心活动识别中
本研究提出一种基于深度神经网络模型的近场活动识别模型,其中使用了通过基于分类的 CNN 网络学习到的高度专业的注意力图,以及融合了空间和时间编码的卷积 LSTM 方法,从而实现了将原始视频级别标签用于弱监督学习。该模型具有较高的准确性。
- 利用机器学习和深度图像预测毫米波网络的主动接收功率
本研究通过利用时空视觉传感信息,展示了主动接收功率预测在可靠毫米波网络中的可行性。通过使用摄像头图像和机器学习,该机制可以预测从下一时刻到几百毫秒后的接收功率时间序列。通过卷积 LSTM 的使用,该机制可以在不到 3ms 的推理时间内,以 - ICCV视频中人群计数的时空建模
通过引入卷积 LSTM 模型,结合了空间和时间依赖关系,并利用双向卷积 LSTM 模型实现了进一步的长距离信息访问,从而有效地提高了人群计数的准确性。同时,我们的模型在少量数据的情况下具有很好的迁移能力。
- ICLR自然视频序列预测的动作与内容分解
提出了一种利用深度神经网络预测自然视频序列未来帧的方法,通过运动和内容分解进行像素级预测,该模型基于编码器 - 解码器卷积神经网络和卷积 LSTM,同时独立捕捉图像的空间布局和相应的时间动态,并在多个时间步长上进行端到端训练。
- CVPR3D 生物医学分割的联合序列学习和跨模态卷积
本文提出了一个基于深度神经网络的编码器 - 解码器结构,包含跨模态卷积层以整合不同模态的 MRI 数据和卷积 LSTM 以建模 2D 切片序列,通过加权和两阶段训练来处理标签失衡,并在 BRATS-2015 数据集上实验表明超越了现有的生物 - 一种基于 LSTM 的显著性关注模型用于预测人眼注视点
提出了一种基于卷积 LSTM 的新型模型,结合神经注意机制,可预测准确的显著图,并学习一组使用高斯函数生成的先验图,这种模型在公共显著性预测数据集上表现优于现有技术,可以克服人眼注视典型的中心偏差,并且对于不同的情境展现了关键组件各自的贡献 - ICLR利用循环神经网络进行可变率图像压缩
本文提出了一种基于卷积 LSTM 神经网络的可变比率图像压缩框架和架构,可以用于压缩缩略图以改善移动设备用户的体验,经测试在 32×32 的缩略图上,与 JPEG、JPEG2000 和 WebP 相比,我们的方法在相同存储大小下提供更好的视