- 零阶极度稀疏 LLMs 的微调
本研究通过将稀疏性和量化技术整合到零阶优化(ZO)细调的大型语言模型(LLM)中,从而解决在内存受限环境(如移动电话和笔记本电脑)中使用 ZO 细调的挑战。研究结果表明,使用 ZO 对 LLM 进行 0.1% 敏感参数细调能优于全面细调,并 - 恶意软件检测中对抗性样本的零阶优化的新形式
机器学习恶意软件检测器对付精心设计的可逃避检测的 Windows 程序的敌对示例存在漏洞。本文介绍了如何将学习恶意软件检测器置于零阶优化框架中,以便融入保持功能性的操作。我们提出和研究了 ZEXE,一种针对 Windows 恶意软件检测的新 - 稀疏 MeZO: 更少参数在零阶 LLM 微调中取得更好性能
通过稀疏的零阶优化方法,提高大型语言模型的内存效率并改善性能。
- 重新考虑用于内存高效 LLM 微调的零阶优化:基准测试
本研究旨在提出一种采用零阶优化的方法,以减少在大规模语言模型训练中由反向传播算法所引起的显著内存开销,从而实现内存更高效的模型微调。
- 大型语言模型的私人微调与零阶优化
DP-ZO 是一种维护训练数据隐私的方法,通过对零阶优化中步长的隐私化来对大型语言模型进行微调,可在保守的隐私预算下提供强大的隐私 - 效用权衡,且在 SQuAD 的 1000 个训练样本上,对 OPT-66B 的微调仅导致 1.86% 的 - 以通信成本不超过 18 千字节的方式对数十亿级语言模型进行联邦全参数调整
使用零阶优化技术以及一组随机种子,FedKSeed 提出了一种新颖的方法来在设备上直接对十亿级别的预训练大型语言模型进行联邦全参数调整,从而显著减少了服务器和客户端之间的传输需求,并通过策略评估 ZOO 扰动的显著性,提升模型准确度,我们的 - SODA: 测试时间数据适配器的稳健训练
通过使用零阶优化方法(ZOO)进行众测数据适应测试,可以改进部署模型在分布变化时的性能降低问题。为了解决受数据适应器可能引起的数据特征破损问题,我们提出了基于伪标签的数据适应方法(SODA),可显著提升部署模型在分布变化下的性能。
- 探索个性化联邦学习的黑盒基础模型:ZooPFL
当个性化联邦学习 (FL) 遇到大型基础模型时,面临着资源限制的多种挑战。本文提出了一种名为 ZOOPFL 的方法,使用零阶优化来解决限制资源和个性化之间的挑战,通过简单而有效的线性投影实现预测和个性化,并通过输入手术方法减少计算成本和增强 - DeepZero:扩展零阶优化以提升深度模型训练
DeepZero 是一个基于 Zeroth-order optimization 的深度学习框架,通过三个主要创新使得 ZO 优化可用于深度神经网络的训练,同时实现了与一阶优化相当的性能,其优点包括坐标梯度估计(CGE)在训练准确性和计算效 - 基于张量压缩的无反向传播训练 (物理信息) 神经网络
该研究论文提出了一种完全不需要使用反向传播的训练框架,通过引入压缩张量方差缩减方法和混合梯度评估方法,以及利用稀疏网格方法估计损失函数中的导数,该方法在训练规模和效率方面存在多个技术贡献,同时在 MNIST 数据集上与标准一阶训练相比,仅略 - 使用轨迹信息的联邦式零阶优化
基于轨迹信息的梯度替代物的联邦零阶优化算法 (FZooS) 通过减少函数查询次数和改进通信效率来提高联邦优化中的效果。
- 镜像自然进化策略
零阶优化利用零阶查询近似一阶和二阶信息的理论研究较少,本文提出了一种重新参数化的目标函数,通过小干扰在极小值点和原始目标函数的 Hessian 逆之间达到极值,并提出了 MiNES 算法来最小化该目标函数,证明了该算法的协方差矩阵估计收敛至 - 基于级联混合优化的安全快速异步竖直联邦学习
本文提出了一个级联混合优化方法来加速零阶优化算法,从而解决基于零阶优化的垂直联邦学习算法的收敛速度慢的问题。该算法在较大模型的训练中非常有效,且具有相当的隐私保护水平。
- 使用预算感知的黑盒逼近技术清理文档图像
本文提出了两种样本选择算法,利用少于原系统 OCR 引擎查询 10% 的数据在不影响系统性能的情况下降低 OCR 预处理器的训练时间,并提出了简单的排名技术以从训练数据集中修剪 30% 的文档图像。
- 利用赌率反馈的表现预测:通过重新参数化进行学习
本研究旨在研究不需要假设空间为凸集且模型对数据分布的映射事先已知的可应用的可执行预测问题。通过开发两级零阶优化算法,该算法一级旨在计算分布图,而另一个级别则将可执行预测目标重新参数化为由所引发的数据分布的函数。在一定的条件下,这种重新参数化 - 零阶优化迎接人类反馈:通过排名预言实现可证明的学习
研究使用一个新的零阶优化算法来解决只有排名反馈的黑盒子目标函数,并将其应用于强化学习中的政策搜索问题以及提高扩散生成模型生成图像质量方面的有效性的问题。
- 使用随机策略网络查找连续动作游戏的混合策略均衡点(无需使用梯度)
本文提出一种基于零阶优化技术、结合平滑梯度估计器和均衡查找动态的方法来解决没有梯度信息的连续行动博弈问题,采用神经网络建模玩家策略,特别是采用随机策略网络来建模混合策略。实验表明,该方法可以快速找到高质量的近似均衡。此外,研究表明,输入噪声 - 零阶 SciML:科学软件与深度学习的非侵入式集成
本文提出了一种使用零阶优化和科学知识源相结合的深度学习训练方案,以弥补在复杂科学领域中由于大量数据需求导致的有限成功。在两个真实的材料科学应用程序中,我们验证了拟议的方案的性能,证明它能够有效地将科学知识与深度学习训练相结合,并且能够在数据 - ICLR如何提高黑盒机器学习模型的鲁棒性?零阶优化视角
本文提出了一种针对黑盒模型的防御式操作,通过基于降噪平滑和零阶优化的方法,将自编码器与模型结合,并在此基础上设计了 ZO-AE-DS,该方法在图像分类和重建任务上表现出更好的准确性、可靠性和查询复杂度。
- 带有定向协调图的分布式合作多智能体强化学习
本文提出了一种分布式强化学习算法,该算法使用直接协调图和局部值函数,通过零阶优化方法进行条件估计,没有使用任何共识算法。与现有的基于零阶优化的强化学习算法相比,我们的算法保证了高可扩展性。