gradient-based optimization | BriefGPT

关键词gradient-based optimization

搜索结果 - 86

重新审视用于 $k$- 子集抽样的得分函数估计器
评分函数估计器作为一个被低估的方法，可用于学习 k - 子集抽样。在许多机器学习任务中，k - 子集抽样是一个基本操作，不利于可微参数化，从而阻碍了基于梯度的优化。本研究通过离散傅里叶变换有效计算 k - 子集分布的评分函数，并通过控制变量
PDF5 days ago
有限算子学习：连接神经算子与 PDEs 的高效参数解和优化的数值方法
通过结合神经算子、物理约束的机器学习和常规数值方法，我们提出了一种解决偏微分方程的方法，该方法在单一框架内扩展了前述方法并将其统一起来，使得我们能够以无数据的方式对参数化的偏微分方程进行求解，并提供准确的灵敏度，即解空间对设计空间的导数。这
PDF23 days ago
如何提升任何损失函数
使用提供偏离随机猜测的分类器的弱学习算法进行优化，无需一阶信息即可学习任意良好模型。通过使用量子微积分等工具，证明了使用任何损失函数进行优化的可行性，从而在经典 0 阶设置中实现了一项前所未有的成就。
PDF25 days ago
可扩展的深度学习嵌套优化
梯度下降优化在机器学习的成功中起到了关键作用，本研究论文聚焦于嵌套优化问题，特别是超参数优化和生成对抗网络；然而，在大规模求解嵌套问题时，经典方法往往表现不佳，因此我们针对深度学习环境构建了可扩展的嵌套优化工具。
PDFa month ago
Fed-Sophia: 一个高效的二阶联邦学习算法
本文章介绍了一个可扩展的二阶方法 Fed-Sophia，通过结合梯度的加权移动平均和剪切操作来寻找下降方向，并使用海森矩阵对角线的轻量级估计来融入曲率信息。数值评估表明，与一阶和二阶基准相比，所提出的 Fed-Sophia 算法在优越性、鲁
PDF2 months ago
ICML在黎曼流形上的无学习率随机优化
我们介绍了一种无需调整学习率的创新随机优化算法，用于在 Riemannian 流形上进行优化，消除了手动调整的需求并提供了更稳健和用户友好的方法。通过数值实验证实了我们的方法，表现出与依赖学习率的算法相竞争的性能，并建立了最优的高概率收敛性
PDF2 months ago
利用贝叶斯优化进行锂离子电池电化学模型的参数辨识
本研究利用贝叶斯优化方法调整镍锰钴 - 石墨电池的动态参数，对比了梯度下降和粒子群优化方法，结果显示贝叶斯优化方法在平均测试损失上优于梯度下降和粒子群优化方法分别可减少 28.8% 和 5.8%，同时显著降低了测试损失的方差分别为 95.8
PDF2 months ago
随机和确定模型中的渐变估计和方差减少
在当今时代，计算机、计算和数据在科学研究和发现中的重要性不断增加。本论文主要关注梯度本身，解决非线性优化问题，并介绍了逆向微分的概念和应用，以及分段连续模型的使用案例。
PDF2 months ago
IJCAIFedGCS: 通过基于梯度的优化在联邦学习中进行高效客户端选择的生成性框架
FedGCS 是一种创新的生成式客户端选择框架，它通过将客户端选择过程重新定义为生成任务来有效地编码丰富的决策知识，并利用梯度优化在连续表示空间中搜索最佳客户端选择，并通过波束搜索生成最终的最优客户端选择，从而在模型性能、延迟和能源消耗方面
PDF3 months ago
DMesh: 一种通用网格的可微表示
我们提出了一种可导表示 DMesh，用于一般的三维三角网格。DMesh 考虑了网格的几何和连通性信息。在我们的设计中，我们首先基于加权 Delaunay 三角剖分 (WDT) 获得一组紧凑的凸四面体，并基于 WDT 以可导的方式提出面存在的
PDF3 months ago
学习与三维旋转，SO (3) 的自助指南
这篇论文综述了旋转表示的选择问题，阐述了其在深度学习与基于梯度优化的问题中的优劣性，提供了基于输入输出是否包含旋转以及数据是否主要由小角度构成的情况下选择合适表示的指导。
PDF3 months ago
基于梯度的计算颗粒晶体设计
基于波动信息处理设备，通过梯度优化设计方法可以扩展多孔材料设计空间并实现机械计算。
PDF4 months ago
基于梯度的组成设计高温超导体的高效探索
我们提出了一种基于梯度优化的材料设计方法，通过优化成分克服了传统方法的局限性，优化输入以使模型的输出与目标属性紧密对齐，从而便于发现未列出的材料和精确属性确定，应用于探索高临界温度超导体时，我们确定了超越现有数据库的潜在成分，并通过条件优化
PDF4 months ago
释放大语言模型作为启发优化器的潜力：一种与基于梯度的模型优化器的类比分析
自动提示优化是改进大型语言模型性能的重要方法。本文提出了一种新颖的视角，通过与基于梯度的模型优化器进行类比，设计了改进的 LLM-based 提示优化器的策略。实验结果表明 GPO 具有有效性和高效性，并分别相对基准方法在 Big-Benc
PDF5 months ago
ResQuNNs: 促进量子卷积神经网络中的深度学习
在本文中，我们提出了一种新的框架来增强可训练的量子卷积神经网络（QuNNs）的性能，通过引入可训练的 quanvolutional 层并解决与其相关的关键挑战。我们的研究通过在这些层中实现训练，显著提高了 QuNNs 的灵活性和潜力。我们引
PDF5 months ago
动态系统中深度神经网络在线自适应的控制理论技术
利用控制论技术，通过在线适应法更新深度神经网络参数，控制域偏移以及解决稳定性和迁移学习问题，提高深度神经网络基于学习的系统的性能和保证。
PDF6 months ago
猎豹：高速可微分模拟融合机器学习与粒子加速器物理学之间的鸿沟
Cheetah 是基于 PyTorch 的高速可微线性束线动力学代码，通过多个量级减少计算时间，为加速器调谐和系统识别提供了高效的梯度优化方式，并且可与广泛采用的机器学习工具无缝集成，简化了基于机器学习方法为粒子加速器开发并快速融入日常运营
PDF7 months ago
通过高阶导数总结将牛顿法应用于神经网络
本研究论文介绍了一种基于梯度的优化方法，并提出了一个计算上廉价的技术，用于获得有关张量之间交互关系的二阶信息。使用这种技术，构建了适用于各种深度神经网络结构的二阶优化方法，避免了计算 Hessian 矩阵和其近似的复杂性，并改善了现有的对角
PDF8 months ago
SoftMAC：基于预测接触模型的可微软体仿真与关节刚体和服装的双向耦合
通过可微分物理模拟和基于梯度的优化，SoftMAC 框架结合了软体、关节刚体和服装，有效解决了在机器人操纵中集成多种材料的关键难题，并通过实验证明了其在机器人操纵应用中的有效性和准确性。
PDF8 months ago
梯度下降无法学习高频函数和模块算术
通过梯度优化算法训练高频周期函数或模运算存在限制和挑战，即使频率或质数基数 - p 很大时梯度的方差也非常小，从而阻止该学习算法的成功。
PDF9 months ago