- 利用量子混合求解器解决双目的二次分配问题
本研究探讨了在使用混合量子求解器解决双目标二次分配问题的情境下的标量化方法,并展示出与先前研究在不同的 Ising 机器上一致的结果。
- 演化强化学习的合作协同进化
本文提出了一种新颖的合作共进化强化学习(CoERL)算法,旨在解决高维度神经网络优化效率问题,通过将策略优化问题分解为多个子问题并进化各个子问题的神经网络种群,使用部分梯度来更新策略,以提高采样效率。在六个基准运动任务上的实验表明,CoER - 利用机器学习的数字化孪生模型用于预测和决策优化:在污水处理中的应用
利用预测和优化技术可以提高城市公共事业中污水处理的操作效率。
- 动态品质多样性搜索
该论文介绍了一种新颖且通用的动态质量多样性 (Dynamic QD) 方法,旨在在环境发生变化的情况下更新过去解决方案的存档,并将其应用于进化搜索的动态环境。
- IntSat: 基于冲突驱动约束学习的整数线性规划
通过扩展冲突驱动子句学习技术,本文使用基于整数线性规划方法处理复杂的实际问题,并讨论该方法在优化方面的潜在改进。
- ICLR用二阶镜头看 Adam
将基于梯度的一阶方法和基于曲率的二阶方法相结合的 AdamQLR 优化器在回归和分类任务中进行评估,以实现与运行时竞争性的广义性能。
- 使用量子焙烧二元梯度的预测随机梯度下降
我们提出了一种新颖的适用于量子硬件上训练二进制神经网络(BNNs)的逐层随机优化器 QP-SBGD。通过在实践中解决二进制神经网络优化器的挑战,我们展示了该更新规则的收敛性,并介绍了在量子计算中如何有效执行映射和投影操作。此外,该方法逐层实 - 神经网络训练中的离散漂移和平滑正则化
通过研究梯度下降算法以及解决离散化漂移问题,从而改善深度学习中的优化和模型正则化,以及探索平滑正则化与优化之间的相互作用。
- 优化大型语言模型以加快智能合约开发
MazzumaGPT 是一种经过优化、可生成智能合约代码的大型语言模型,旨在帮助开发人员构建 Web3 应用并提高生产力。本研究介绍了模型的优化和微调参数,评估了其在功能正确性上的性能,并讨论了我们研究的局限性和广泛影响。
- 逆向渲染的联合采样和优化
使用 Monte Carlo 估算的梯度进行优化参数时,通过对每次迭代进行多个梯度样本的平均化可以减少方差。然而,对于需要进行数千次优化迭代的问题,这种方法的计算成本会迅速上升。我们推导了一个理论框架,通过交错采样和优化,更新和重复使用过去 - 具有因果结构的优化问题中的最佳观测干预平衡
我们考虑在有限预算内优化一个昂贵的灰箱目标函数的问题,其中存在已知的设计变量间的因果结构的副信息。标准黑箱优化忽略了因果结构,往往导致低效和高成本。已有的少数考虑因果结构的方法是目光短浅的,并未充分考虑估计因果作用时出现的观测干预权衡。在本 - 随机梯度下降中的隐式规则化:从单目标到两人博弈
本篇研究提出了一种基于离散优化器的连续时间流的后向误差分析方法,用于构建可以被写成梯度形式的矢量场的流,从而找到以前未知的隐式正则化效应。
- 面向 CNN 和视觉 Transformer 的 B-cos 对齐
本文提出了使用 B-cos 转换来增加深度神经网络可解释性的新方向,并设计了用于优化和权重对齐的转换,可以轻松地与计算机视觉领域中最先进的模型相融合。
- 通过贝叶斯积分实现具有多样性约束的领域无关批量贝叶斯优化
提出了一个基于 SOBER 方法的领域不可知的谨慎并行主动采样器,用于解决有多种约束和 / 或不传统输入空间的实际优化问题,包括安全受限制的药物发现和图形结构空间上的人际关系意识的团队优化,并考虑未知的约束条件下目标函数查询拒绝的情况。
- 面向会话推荐的自对比学习
本研究提出自我对比学习算法,并将其应用于会话推荐问题中,以优化物品表示空间的均匀度和减少模型复杂度,进而实现比之前的算法更好的预测性能。研究证明,该算法不需要额外的采样和数据增强操作,并在三个基准数据集上得到了统计上显著的性能提升。
- UAdam: 非凸随机优化的统一 Adam 型算法框架
我们介绍了一个统一的 Adam 型算法框架 (UAdam),并在非凸随机设置下对其进行了收敛性分析,证明 UAdam 以 $\mathcal {O}(1/T)$ 的速率收敛于传统的 Adam 型算法 (如 NAdam、AMSGrad、Ada - 基于游戏的人工智能研究平台
本文回顾了基于游戏的平台在人工智能研究中的应用,讨论了这些平台的演化引起的研究趋势,并展望了未来的发展。
- Phylo2Vec:二叉树的向量表示
本文介绍了一种新的用于最大似然推断的优化方法 —— 基于 Phylo2Vec 的 hill climbing-based 优化算法,该算法结合了二叉进化树和机器学习优化的优点,旨在解决 NP - 难问题。
- 自动梯度下降:无超参数的深度学习
本文提出了一个新的框架来得出能够自动、无需超参数训练全连接和卷积神经网络的一阶优化器:自动梯度下降。该理论为下一代结构相关的优化器提供了严谨的理论基础。
- QDP:学习依次优化准静态和动态操作元素以实现机器人布料操作
提出了一种基于序贯强化学习的 Quasi-Dynamic Parameterisable(QDP)方法,用于优化静态和动态操作基元的运动速度和拾取和放置位置的参数,以提高布料操纵性能。在模拟和真实世界的实验中,结果表明通过优化基元的参数,性