一种基于随机优化的训练非线性神经网络的高阶全变差正则化方法

MMAug, 2023

一种基于随机优化的训练非线性神经网络的高阶全变差正则化方法

A stochastic optimization approach to train non-linear neural networks with regularization of higher-order total variation

PDF

Akifumi Okuno

TL;DR高度表达的参数模型，如深度神经网络，在建模复杂概念方面具有优势，但这种高度非线性模型的训练已知存在高风险的过度拟合问题。为了解决这个问题，本研究考虑第 k 阶总变差（k-TV）正则化，该正则化定义为被训练的参数模型的 k 阶导数的平方积分，对 k-TV 进行惩罚有望产生更平滑的函数，以避免过度拟合。虽然应用于一般参数模型的 k-TV 项由于积分而具有计算上的困难，但本研究提供了一种随机优化算法，可以在不进行显式数值积分的情况下高效训练具有 k-TV 正则化的一般模型。所提出的方法适用于结构任意的深度神经网络的训练，因为它只需使用简单的随机梯度下降算法和自动微分即可实现。我们的数值实验表明，采用 K-TV 正则化训练的神经网络比传统参数正则化训练的神经网络更 “弹性”。所提出的算法还可以扩展至神经网络（PINNs）的物理知识训练。

Abstract

While highly expressive parametric models including deep neural networks have an advantage to model complicated concepts, training such highly non-linear models is known to yield a high risk of notorious

parametric models total variation regularization overfitting stochastic optimization algorithm neural networks

发现论文，激发创造

NeurTV: 神经领域上的总变差

在这篇论文中，我们提出了一种在神经领域上定义的新型全变差（TV）正则化方法，通过使用深度神经网络（DNN）输出相对于输入坐标的导数来捕捉数据的局部相关性，实验证明这种方法在不同类型的数据上都非常有效。

May, 2024

高阶全变差正则化最小二乘预测界

对于趋势过滤，我们通过将对总变异率的 k-1 阶差异惩罚与最小二乘估计相结合，并使用 “插值向量” 来上界 “有效稀疏度”，为其建立自适应结果。我们证明了 k∈{1,2,3,4} 的结果，并指示了如何导出 k∈$\mathbb {N}$ 的一般情况。

Apr, 2019

少视角层析成像中由学习技术增强的空间变差全变差

该研究聚焦于开发一种用于解决欠定线性反问题的空间变异正则化模型。研究案例为从少视角层析噪声数据中重建医学图像。通过应用适当的像素相关权重，该优化模型的主要目标是在去噪和保留细节和边缘之间取得良好平衡，克服了广泛使用的总变差（TV）正则化方法的性能。提出的策略利用梯度逼近来计算空间变异 TV 权重。为此，设计了一个卷积神经网络，使用其训练中的弹性损失函数来逼近真值图像及其梯度。此外，本文对所提出的模型进行了理论分析，展示了其解的唯一性，并展示了针对特定问题的 Chambolle-Pock 算法。这一综合框架将创新的正则化技术与先进的神经网络能力相结合，展示出在从低采样层析数据中实现高质量重建方面的有 promising 结果。

Apr, 2024

合作总变差：矢量 TV 模型的通用框架

本文提出了一种基于三维张量的颜色图像的协作总变差（CTV）型正则化方法，通过在不同维度上取不同范数来确定它的平滑性，不同的范数具有不同的性质。在理论和实践方面得到了很好的验证和应用。

Aug, 2015

高阶全变差正则化模型的双层参数学习

研究使用双层优化方法在高阶总变分图像重建模型中进行参数学习，提出并分析一种基于 Huber 正则化 TV 半范数的替代代价，验证解算符的可微性，并推导出一种一阶最优系统。基于伴随信息，提出了一个拟牛顿算法来数值解决双层问题。通过数值实验展示了我们的方法的适用性和新代价函数的改进性能。同时，利用双层优化框架，对比了 TGV^2 和 ICTV，在处理图像结构和噪声水平方面的优缺点。

Aug, 2015

超越线性化：关于宽神经网络的二次及高阶逼近

该研究探讨了超参数化神经网络的训练，通过随机化神经网络，使其模型不再受限于 NTK，允许其与二次模型进行耦合，并且证明了产生的随机网络的优化具有良好的局面性态，且样本复杂度与 NTK 相匹配，同时在分布特定条件下可更为优秀。

Oct, 2019

神经梯度正则化器

我们提出了一种神经梯度正则化器 (NGR)，将梯度图表达为神经网络的输出，避免了梯度图的低估，具有广泛的适用性和插拔式功能。

Aug, 2023

在总变差距离下调整语言生成模型

采用总变差距离 (TVD) 为目标函数以及 TaiLr 目标函数，可以改善自回归解码期间的文本退化问题，同时在各种文本生成任务中提高生成质量。

Feb, 2023

使用具有重叠组稀疏性的全变差进行图像恢复

本研究提出使用重叠组稀疏总变差正则化器的优化问题，通过 $l_2$ 数据保真度项，避免楼梯状效应，从而实现保留边缘特征的图像恢复。同时，我们还提出了一种快速算法，并与现有的 TV 和 HTV 算法进行了比较，数值实验证明了该方法在 PSNR，相对误差和计算时间方面的高效性和有效性。

Oct, 2013

多维总变差正则化的模块近端优化

本文研究了电视正则化，对于 l_p - 范数 TV 提出了有效的算法，特别是对于 l_1 - 范数 TV 提出了一种新的几何分析方法，揭示了与 taut-string 方法的未知联系，并利用我们的几何引导实现了高效的 1D-TV 求解器，提供了更复杂（二维或多维）电视求解器的支撑，并探讨了通过广泛的实验在图像和视频降噪方面的优越性。

Nov, 2014