- CADE: 余弦退火差分进化用于尖峰神经网络
通过引入余弦退火差分进化(CADE)方法,本论文尝试解决脉冲神经网络(SNNs)优化的挑战,通过调整差分进化(DE)的变异因子和交叉率来获得更好的收敛和准确性。使用基于迁移学习的初始化方法对 SNN 进行改进,进一步提高了 CADE 的性能 - 针对安全定向 LLM 的改进对抗样本生成
通过借鉴转移式攻击的思想,结合渐变式对抗性提示生成过程,我们改进了自动生成的对抗性示例以攻击白盒大语言模型,取得了显著的性能提升,同时也提出了新的见解和适当的方法组合。
- 高效的集成改进训练数据归因
我们提出了两种高效的集成策略,DROPOUT ENSEMBLE 和 LORA ENSEMBLE,可以显著降低训练时间(高达 80%),服务时间(高达 60%)和空间成本(高达 80%),在保持与原有独立集成相似的归因效果的同时,有效地改善了 - 基于扰动的递归神经网络学习
本研究针对循环神经网络提出了一种基于扰动学习的新方法,通过在时间域内进行节点扰动,实现与反向传播方法相媲美的性能,具有超越梯度方法的优势,证明了扰动学习方法是训练循环神经网络的一种多功能替代方案。
- 通过正则化策略提高变分量子电路的可训练性
在嘈杂中等规模量子(NISQ)时代,本研究提出一种使用先验知识和高斯噪声扩散来规范化模型参数的策略,以提高量子变分电路的可训练性并解决梯度问题。实验证明这种方法对超越经典模型的四个公共数据集的可训练性具有改进作用。
- LancBiO:基于 Krylov 子空间的动态 Lanczos 辅助双层优化
通过 Lanczos 方法构建低维近似 Krylov 子空间,解决偏导数求逆问题,提高双层优化问题的效率,并在合成问题和深度学习任务中展示了收敛速度和效率。
- 基于前向梯度级联法的高效深度神经网络训练优化
使用前向模式自动微分进行梯度计算的 Frank-Wolfe 算法具有次线性收敛速度,并优于使用后向传播方法的标准 Frank-Wolfe 算法,同时研究了深度神经网络和梯度计算的性能。
- 可证明的基于策略梯度法的平均奖励马尔可夫潜力博弈方法
研究马尔可夫潜势博弈在无限时间平均回报准则下,证明基于独立策略梯度和独立自然策略梯度的算法都能在全局收敛到纳什均衡点,同时提出了渐进性和底座条件,通过梯度和微分值函数的灵敏度边界为梯度方法奠定了基础,并证明了三种算法的收敛性以及具体的时间复 - 权重纠缠与基于梯度的神经架构搜索
本文旨在通过提出一种新的方案,将基于梯度的方法适应于权重相互关联的空间,从而弥合这两个子社区之间的差距,并深入比较评估梯度优化方法在权重相互关联的搜索空间中的性能,结果发现这种权重相互关联和基于梯度的 NAS 的整合带来了增强性能、改善超网 - 基于梯度的方法学习离散对数的难解性
研究了梯度法在有限循环群中学习离散对数奇偶位的局限性,理论和经验证实发现梯度函数集中在一个固定点附近,不管所使用的对数的基。通过使用内积空间中的 Boas-Bellman 不等式以及建立离散对数奇偶位函数的近似正交性,对于基于梯度的学习的限 - 梯度反击:滤除高频率如何改善解释性
预测基于的归因方法相对于梯度基于的方法表现更好的原因是因为前者的高频信息更少,通过优化低通滤波器可以改善梯度基于的归因方法的表现。
- 分发协同功能:统一博弈论交互方法以实现机器学习可解释性
本文介绍了一种基于博弈论的归因和 k 阶相互作用方法的统一框架,重点是解释和解释模型的透明性。作者指出,各种方法都基于其在协同方案中的政策,并介绍了基于梯度的独特方法。最后,作者提出了需要深入了解归因和交互方法的目标和上下文。
- 告诉模型去关注什么:通过小型解释注释来提高方面情感分类的可解释性
本文提出了一种基于梯度的 IAGA 框架,通过少量解释注释来解释复杂神经网络的 ABSC 模型,以提高模型的可解释性,性能和鲁棒性。
- 基于梯度的价值估计的高效实现
本文研究了值估计的梯度方法在强化学习中速度较慢的原因,提出了一种基于 Gauss-Newton 方向的低复杂度非批量化近端方法,并介绍了主要算法 RANS 及其在经典问题中的表现。
- 利用稀疏连接和选择性学习的在线实时递归学习
这篇论文介绍了一种基于循环神经网络的状态构建方法,提出了能够让实时递归学习可扩展的两个约束条件,并在基准测试和政策评估中证明了其有效性。
- 计算机视觉中基于归因的可解释 AI 方法综述
本文对计算机视觉中基于归因的 Explainable AI (XAI) 方法进行了全面概述,并回顾了梯度、扰动和对比方法,提供了开发和评估强健 XAI 方法的关键挑战的见解。
- 基于决策论熵的贝叶斯优化泛化
本文提出一种基于 Sherman 逻辑的不确定性泛化度量,将它应用到贝叶斯优化中来表征不确定性,从而解决了当前信息理论 BO 算法无法考虑后续过程的问题,并且提出一个以此为基础的灵活的获取函数家族。最后,作者还开发了一种基于梯度的方法来高效 - ICML解决数据异构性:带有样本诱导拓扑的新分布式 SGD 统一框架
本研究提出了一个通用框架,用于统一集中式和分布式场景下的多个基于梯度的随机优化方法,通过引入一个增光图,设计了一种合适的拓扑结构,使得 VR 和 GT 方法能够有效消除设备内外的数据异质性,并提供了一种统一的收敛分析。
- ACL自然语言模型理解中的本地聚合特征归因
本文提出了用于自然语言处理模型的新型基于梯度的特征暗示方法(Locally Aggregated Feature Attribution,LAFA),通过汇集从语言模型嵌入推导出的类似参考文本来平滑梯度,以实现对模型的解释性。该方法在公共数 - CVPRCAFE:通过特征对齐学习压缩数据集
本文提出了一种名为 CAFE 的新方法来压缩数据集并 align 真实数据和合成数据的特征,以防止梯度偏差。我们的方案通过动态双级优化和适应性参数更新以防止过度拟合,并通过广泛实验验证了其有效性。