- 约束的演员 - 评论家算法和约束的自然演员 - 评论家算法的有限时间分析
通过应用 Lagrange 乘数法,我们对带有不等式约束的 C-MDP 中的 actor critic 和 natural actor critic 算法进行了非渐近分析,并证明这些算法在非独立同分布(Markovian)环境中能够找到性能 - 基于不等式约束的零遗憾执行预测
对于受到不等式约束的可行预测问题,本文在鲁棒的原始对偶框架基础上提出了一种自适应的原始对偶算法,通过数值模拟验证了算法的有效性和理论结果,该算法在不等式约束下达到 O (√T) 的后悔与约束违规,使用了√T + 2T 个样本。
- 受限域的扩散模型
本研究提出两种方法来扩展扩散模型至通过不等式约束定义的流形,包括基于对数障碍度量的失真度量以及基于反射布朗运动的失真度量,在合成和真实任务中进行了实证表明,包括蛋白质骨架和机器人臂运动的约束构象模拟。
- MM约束引导梯度下降:不等式约束指导下的训练
本研究提出了约束引导梯度下降 (CGGD) 框架,使得域知识可以注入到神经网络的训练过程中,其中域知识被假定为一组硬不等式约束的连词,相比于其他神经符号方法,该方法使得模型收敛并满足数据集上的任何不等式约束,同时不需要事先将约束转换为某个特 - CVPR边缘的恶魔:基于边缘的标签平滑方法用于网络校准
本文研究了深度神经网络在预测时存在过度自信的问题,并提出了一种基于不等式约束的优化方法,以达到最佳判别性能和预测校准性能的折中。
- DeepOPF: 一种面向 AC 最优潮流问题的可行性优化深度神经网络方法
使用深度神经网络(DeepOPF)方法解决交流最优潮流(AC-OPF)问题可提高计算速度两个数量级,并且可以保持物理和运行约束的一致性,并使用零阶梯度估计技巧在培训过程中维护剩余的不等式约束条件。
- 约束下的黎曼流形优化简单算法
本文介绍了扩展现有算法,从欧几里得情况到黎曼情况的从等式和不等式约束中考虑代码优化问题,在高维下实现计算效率与准确度的提高,具有重要的实践应用。
- 基于约束 CNN 的弱监督分割损失函数
本文提出一种基于不等式约束的 CNN 弱监督分割方法,通过引入可微分约束惩罚项,使训练过程中的非标注数据指导网络的学习,经实验证明该方法相比于先前研究的 Lagrangian 方法能够更加优化,并降低了训练过程的计算复杂度。
- 线性不等式约束下的有限维高斯近似
通过引入不等式约束条件,我们可以采用有限维高斯方法来处理线性不等式集,并探索使用马尔可夫链蒙特卡洛技术来近似后验分布,研究了关于协方差参数估计的约束似然函数的理论和数值特征。实验证明基于哈密顿蒙特卡洛取样器的全框架能够提供有效的数据拟合和不 - 混合限制条件下带松弛变量增广 Lagrangian 的贝叶斯优化
介绍了一种基于松弛变量的增广 Lagrangian 方法,用于优化包括等式和不等式约束的问题。该方法可以用库例程计算 EI,与传统方法相比表现优异。
- 具有不等式约束的计算机实验高斯过程仿真器
提出了一种将数据插值和不等式约束合并到高斯过程模拟器中的模型,该模型利用功能分解近似原始高斯过程,计算条件高斯过程的平均值、模态和预测间隔,以及对边界、单调性或凸性条件等等应用条件模拟来验证模型性能。
- 离散贝叶斯网络的边缘
本文研究使用离散的观察变量和不对潜在变量的状态空间作任何假设的情况下,贝叶斯网络模型中的潜在变量的完整代数特征,并证明它与所谓的嵌套马尔可夫模型代数上等价。因此,这种嵌套马尔可夫模型是避免考虑不等式的潜在变量模型的最佳描述,并且能够轻松使用 - 因果模型中带有潜在变量和工具变量的可测性
本文提取了某些牵涉到未测量变量的因果模型,虽然在观测到的变量之间不会产生独立性约束,但仍然会暗示观测分布的不等式约束。利用一个通用公式推导出了这样的工具变量(instrumental variables),即直接影响某些变量但不影响所有变量