- 一种具有对数复杂度和遗憾保证的在线基于梯度的缓存策略
我们引入了一种基于梯度的在线缓存策略,相对于目录大小具有对数计算复杂度,同时提供遗憾保证,能够在实时决策和最佳后见选择之间最小化性能差距。
- 引导绝对梯度:梯度大小对解释定位和显著性的影响
本文提出了一种新的基于梯度的 XAI 方法,称为引导绝对梯度方法,用于显著图解释。我们利用正负梯度幅度,并采用梯度方差来区分噪声扣除的重要区域。我们还引入了一种名为 ReCover And Predict(RCAP)的新型评估指标,考虑到解 - KDD微温度即可完成可微架构搜索
通过利用小的温度值来稀疏化训练阶段中的连续分布,来缩小训练中弱化超网络与评估中的修剪后网络之间的差距,以提高 Differentiable Architecture Search 的效率和功效。
- KDD自适应梯度基础离群值去除的噪声标签学习
提出了一种新的自适应基于梯度的异常点去除方法 AGRA,通过比较批量样本的聚合梯度和单个样本梯度,动态决定是否剔除数据集中的异常点。在多个数据集上进行广泛评估,证明了 AGRA 的有效性,同时全面的结果分析支持了初步的假设:永久性的硬异常点 - DoWG Unleashed: 高效通用无参梯度下降方法
DoWG 是一种新的易于实现的无需调参的梯度下降算法,通过保留运行平均差值的加权版本达到最佳状态,并显示出其适用于优化平滑和非平滑问题,同时还揭示了 AdaGrad 算法成功背后的基本原理。
- 基于梯度的双层优化在深度学习中的应用
本篇综述论文研究了基于梯度的双层优化方法在深度学习中的应用和发展,通过探讨单任务和多任务优化问题的双层公式和四种优化器的应用,展示其在优化超参数和提取元知识方面的实用性和高效性,最后指出其广阔的科学问题应用前景。
- EMNLP追溯语言模型中的事实知识来源于训练数据
本研究探讨了语言模型(LM)如何从训练数据中记忆大量的事实知识,同时提出了事实追溯的问题。为了解决该问题,比较了基于梯度和嵌入的两种不同的训练数据指向(TDA)方法,并发现仍有很大的改进空间。
- GrASP: 基于梯度的可供性选择规划
本篇论文主要探讨在大规模强化学习领域中,如何解决在使用树搜索规划时处理连续动作空间的问题,并通过学习选取能够有助于规划的可接受行为(Affordances),并以基于梯度下降的方法更新其参数,从而实现同时学习选取单元行为和规划带有学习后价值 - ICLR序列建模的长记忆
提出了一种名为长表达记忆(LEM)的新方法,用于学习长期顺序依赖关系,它可以通过梯度进行高效处理并且具有足够的表达能力,能够学习复杂的输入输出映射,通过实验验证了 LEM 在图像分类、时间序列分类、语音识别、语言建模等任务中的优越性。
- ICCV元梯度对抗攻击
本文提出了一种名为 Meta Gradient Adversarial Attack(MGAA)的新型结构,采用元学习的思想,插入攻击方法以提高跨模型的传递性,通过缩小白盒和黑盒攻击之间的梯度方向差距来改善黑盒设置下的对抗样本的传递性。在 - MEGEX:基于梯度的可解释人工智能无数据模型提取攻击
本文提出了 MEGEX,针对一种梯度可解释人工智能的数据自由模型提取攻击。攻击者使用解释结果来训练生成模型以减少查询次数,可以在不准备输入数据的情况下成功窃取训练好的模型。实验表明,在 SVHN 和 CIFAR-10 数据集上,给定 200 - ICLRCharformer: 基于梯度的子词分词加速字符变换器
该研究提出了使用渐变学习的子单词标记模块(GBST)作为深度 Transformer 模型 Charformer 的一部分来进行端到端学习,以在自然语言处理中改进字节级模型的性能。在英语 GLUE、多语言和噪声文本数据集上的结果表明,Cha - ECCV学习传播规则用于生成归因图
提出使用可学习插件模块生成归因图的方法,用于在非线性层的反向传播过程中自动学习传播规则,该方法在五个数据集和六个网络架构上实现了最先进的结果。
- 面向对象检测的通道级高效神经架构转换搜索
本文介绍了一种新的基于梯度的神经架构变换搜索算法 (NATS),它可以将以图像分类为目的设计的神经网络重新构建为目标检测网络,而且不需要额外的参数和计算量,“transformed networks” 在 COCO 数据集上表现显著提高,适 - 基于梯度元学习的泛化理解探索
本文研究了神经网络在基于梯度的元学习中的泛化问题,分析了目标景观的各种特性,提出了一种新的正则化方法以增强模型的泛化能力。实验表明,在元训练提供的元解决方案的基础上,通过几步基于梯度的微调适应元训练模型到新任务时,所得到的元测试解决方案变得 - ICML图卷积网络的可解释性技术
探讨利用基于梯度和分解两种主要技术在一个玩具数据集和化学任务上提高 Graph Networks 决策的可解释性,为未来的开发和真实世界问题的应用奠定了基础。
- CVPR超越可解释性:利用可解释性改进对抗学习
研究中提出了一种基于梯度解释性的新策略,通过在易感区域引导对单像素对抗扰动的学习,能在保证对抗性的同时,提高收敛速度,并使攻击难以察觉。这一方法充分利用了解释性方法在解释性以外的任务中的有效性。
- ACL零样本序列标注:从句子向标记传递知识
本论文通过构建基于软注意力机制的神经网络架构,分别在四个不同数据集上训练和测试,探究使用注意力或梯度可视化技术能否用于推断二元序列标记问题中的单词级标记,并得出结论:相比梯度 - based 方法,基于注意力的方法能够更准确地预测单词级标记 - 合理的权利:通过限制模型解释进行可微分模型训练
该论文提出了一种基于梯度的快速、高效的方法,用于解释和规范神经网络模型,通过检查和有选择地惩罚其输入梯度,以提供法线,进而改善模型的透明度和可靠性,以避免在训练和测试条件不同时出现错误原因,其效果在多个数据集上验证成功。
- 卷积神经网络内部探究:图像分类模型和显著性地图的可视化
该论文研究了使用深度卷积网络 (ConvNets) 学习的图像分类模型的可视化,提出了两种基于计算类别分数相对于输入图像的梯度的可视化技术,能够最大化类别得分或计算类别显著图以进行对象分割,最后建立起梯度卷积网络可视化方法和反卷积网络之间的