- 高维数据环境下基于模拟的推断的扩散后验采样
在非线性模型中,我们提出了一种基于模拟推理和分数网络的方法,利用多个观测值的共享信息来更好地推断模型的参数,并在各种数值实验中证明了其在数值稳定性和计算成本方面的优越性。
- 一种保守的混合物理信息神经网络方法求解 Maxwell-Ampère-Nernst-Planck 方程
通过使用深度学习工具增强了 Maxwell-Ampere-Nernst-Planck 方程组的数值算法,提出了一种混合算法来确定适当的虚拟变量近似,验证了该方法在二维问题中的有效性,并发现在一维情况下,该方法无法产生合理的结果,但通过实验证 - EMNLP加速具有常数时间推理复杂度的 Toeplitz 神经网络
该研究论文介绍了如何通过将 Toeplitz 神经网络转换为状态空间模型,在推理过程中实现与状态空间模型一样的恒定推理复杂度,从而充分发挥两者的优势,并展示了在语言建模任务中的有效性和数值稳定性。
- 优化控制学习问题中隐式微分的再探
本研究提出了一种使用隐式函数定理(IFT)来区分非凸约束离散时间最优控制(COC)问题中的最优轨迹的新方法,该方法直接评估从应用变量消除到 Lagrange 乘数项的矩阵方程,使得轨迹导数与时间步数呈线性关系,具有易于并行化处理、与模型大小 - 惩罚主成分析中的 Nesterov 平滑
我们在这篇论文中通过应用 Nesterov 平滑到 LASSO-type L1 惩罚上,扩展了 PEP,以更快、更高效地最小化与优化问题相关的目标函数;我们还展示了如何使用奇异值分解的已建立结果来计算更高级的特征向量;最后,通过使用 100 - TSSR:神经网络的截断有符号平方根激活函数
本文介绍了一种名为 Truncated and Signed Square Root (TSSR) 的新型激活函数,具有奇、非线性、单调和可微分的特点,其梯度是连续且始终为正。多个实验证实,所提出的 TSSR 比其他最先进的激活函数具有更好 - 深度学习水动力学预测用于近实时洪涝区域评估(DL Hydro-FRAN)
本文研究使用 DNN 优化水动力洪水模型,通过在 2D HEC-RAS 水动力模型中模拟洪水事件并使用 DNN 预测洪水深度和速度,结果显示 DNN 能够极大地优化水动力洪水模型,实现接近实时的洪水预报,且可以显著提高预报计算时间。同时,该 - 深度前馈网络的稳定和一致训练的证明框架
介绍了一种针对深度神经网络进行有监督训练、无监督训练以及强化学习的新算法,运用标准随机梯度下降法和梯度剪裁法对神经网络进行更新,提出了一种稳定输出层且范围明确的新型激活函数,得出结论:神经网络的更新值稳定,训练更加精确与流畅。
- 使用 FFT 和 GPU 的超快 Zernike 矩
本文提出了一种使用快速傅里叶变换(FFT)和 GPU 计算的新方法来计算 Zernike moments ,该方法可以用于在高阶精确生成瞬时图像,数值精度比其他方法更高,是一种简单快速的方法,并可利用多个编程框架中可用的 GPU-FFT 库 - 神经网络逼近
该篇论文调查了神经网络的近似性质,特别是使用 ReLU 激活函数的非线性流形,并比较了这种近似方法与传统数值分析中使用的近似方法之间的差异,着重分析了数值稳定性问题,发现在一定程度上提高了近似能力,但以数值稳定性为代价。
- 可逆神经网络中爆炸反演的理解和缓解
本文研究了可逆神经网络的数值稳定性,发现常用结构存在逆爆炸现象及无法逆运算等问题,针对不同问题提出了逆问题的解决方法,证明了构建稳定可逆神经网络是重要的。
- ChebNet: 基于切比雪夫逼近的修正幂单元深度神经网络的高效稳定构建
本文探讨了如何构建基于 Chebyshev 多项式逼近的深度 RePU 神经网络,不仅理论上和利用幂级数逼近构建的 RePU 网络具有相同的上限误差界限,而且通过实验发现,ChebNets 比使用幂级数逼近的 RePU 网络更加稳定。
- 反向传播友好型特征分解
介绍了一种在深度网络中利用特征向量的数值稳定且可微分方法,其可处理大矩阵且不需要拆分,并展示了其在 ZCA 白化和 PCA 去噪方面的鲁棒性优于标准的 Eigendecomposition 和 Power Iteration 方法。
- 规范化重要性:深度神经网络中高效准确的规范化方法
本研究提出了一种新的对归一化方法和权值衰减的目的和功能的视角,并建议了几种常用 L2 批归一化的替代方案,包括 L1 和 L∞范数中的归一化,以提高计算和内存效率,并且在低精度实现中大幅提高了数值稳定性,并且还提出了一种改进重要性重归一化的 - 低秩矩阵近似的实用素描算法
该论文介绍了构建输入矩阵的低秩近似的算法套件,这些算法使用矩阵的随机线性图像(称为草图)。这些方法可以保留输入矩阵的结构特性,如半正定性,并且可以生成具有用户指定秩的近似值。此外,每种方法都伴随着一个信息性误差界,允许用户预先选择参数以实现 - 随机梯度下降的稳定性和最优性
提出一种基于平均隐式(averaged implicit)随机梯度下降的迭代过程,旨在解决参数估计过程中的数值不稳定性和统计效率问题。实践证明这种方法比其他现有方法表现更为出色。
- 快速灵活的 ADMM 趋势滤波算法
本文提出了一种用于趋势过滤的快速而稳健的算法,能够达到最小化最优误差率并提高数值稳定性,有利于更广泛的实际应用。
- 解线性系统的高效加速坐标下降方法和更快的算法
该论文介绍了如何加速随机坐标下降方法,提高收敛速度,同时又不用支付每次迭代的代价。它提出了一个新的通用方法,并证明它的收敛性,并在多个领域中获得更快的渐近运行时间。
- 一个简单的组合算法,用于近线性时间解决 SDD 系统
本文介绍了一种简单的组合算法,它几乎在线性时间内解决了对称对角线优势(SDD)线性系统问题,而无需递归预处理、光谱稀疏化或更高精度。算法通过构建与线性系统相关的图的 “好” 生成树,并反复应用一个简单的(非递归的)更新规则来实现。该算法具有