连续图像效果过渡的深度网络插值
本文提出了 Deep Feature Interpolation(DFI)作为高分辨率图像转换的新数据驱动基准,只依赖于从预训练的卷积神经网络中进行深度卷积特征的简单线性插值。我们发现,虽然 DFI 非常简单,但是可以执行高级语义变换,如 “变老 / 年轻”,“加眼镜”,“加微笑” 等,在某些情况下甚至可以匹配或优于最先进的技术。DFI 因此可以作为评估更复杂算法的新基线,并提供了一个实际的答案,回答了在深度学习的崛起中哪些图像转换任务仍然具有挑战性的问题。
Nov, 2016
我们通过控制理论研究将深层残差神经网络作为连续动力系统的表达能力。具体而言,我们考虑从监督学习中产生的两个特性,即通用插值 - 能够匹配任意输入和目标训练样本,以及紧密相关的通用逼近 - 能够通过流映射逼近输入 - 目标函数关系。在控制结构变换族具有仿射不变性的假设下,我们给出了通用插值的表征,证明了非线性网络结构基本上都具备这一特性。此外,我们阐明了通用插值和通用逼近在一般控制系统背景下的关系,证明了这两个特性不能从彼此推导出来。同时,我们确定了控制结构和目标函数的条件,确保了这两个概念的等价性。
Sep, 2023
本文提出了使用经验插值法(EIM)算法在监督机器学习中高效降低训练数据维度的方法(称为 DNN-EIM),并对数据科学和参数化(和时变)偏微分方程(PDE)的应用进行了考虑。在分类情况下,为每个类训练并行的 DNN,这种方法是顺序的,即可以添加新类而无需重新训练网络。在 PDE 情况下,为每个 EIM 点设计一个 DNN。在所有情况下,平行网络需要少于十倍的训练权重,观察到在不牺牲准确性的情况下,训练时间的显着提高。
May, 2023
通过离散化有控制的常微分方程(也称为神经常微分方程)以及一些连接性,我们研究表达性质并展示了通用差错的普适插值性质(比通用逼近性质稍弱),并探究最少参数个数在保证表达能力的情况下的取值。
Aug, 2019
本论文提出了三种简单、紧凑而有效的深度序列表示,称为 DDI、DDNI 和 DDMNI,用于孤立和连续行为识别。在这些动态图像上,设计了基于 ConvNet 的方法进行行动识别,取得了三个大型数据集上的最先进结果,即 Large-scale Continuous Gesture Recognition Dataset(Jaccard 指数 0.4109)、Large-scale Isolated Gesture Recognition Dataset(59.21%)和 NTU RGB + D Dataset(跨主体 87.08%和跨视角 84.22%),即使只使用深度模态。
Mar, 2018
该论文提出了三种简单、紧凑而又有效的深度序列表示方法,分别称为动态深度图像 (DDI)、动态深度法线图像 (DDNI) 和动态深度运动法线图像 (DDMNI)。这些动态图像是从一系列深度图像构建而成的,使用双向排名池化来有效地捕捉时空信息,从而使我们能够对已经训练好的卷积神经网络 (ConvNets) 模型进行微调,以用于深度序列的分类。在该论文提出的基础上,我们开发了一个卷积神经网络 (ConvNets) 方法,用于手势识别,并在 2016 年 ChaLearn Looking at People(LAP)挑战赛的大规模隔离手势识别中进行了评估,达到了 55.57%的分类准确率,并排名第二,虽然只使用了深度数据,但非常接近最佳表现。
Jan, 2017
我们提出了一种基于深度网络的隐秘传输方法,使用渗透策略将秘密深度网络模型潜入一个伪装的普通学习任务中,并使用渗透策略激活干扰滤波器,以实现深度网络模型的隐蔽通信。
Jul, 2023
本文提出了自我强化深度图像先验(SDIP)作为原来深度图像先验(DIP)的改进版本,并证明了在多个应用领域中,SDIP 框架相较于原始 DIP 方法和其他先进方法具有改善。
Apr, 2024
本研究提出了新的、广义的标准化模块 ——Dynamic Instance Normalization(DIN),通过组成实例标准化和动态卷积将风格图像编码成可学习的卷积参数,从而实现了灵活且更高效的任意风格转移。实验结果表明,所提出的方法在具有挑战性的风格模式上具有非常鼓舞人心的结果,并且是使用基于 MobileNet 的轻量级架构进行任意风格转移的首次,并且在计算成本方面比现有方法提供了超过 20 倍的降低因素。此外,所提出的 DIN 为最先进的卷积操作提供了灵活的支持,因此触发了新的功能,如非自然图像的均匀笔触位置和自动空间笔触控制。
Nov, 2019