弹性受限学习
我们提出了一种新的约束强化学习方法,通过在学习目标中引入放松成本来适应放松约束,以实现对策略和约束规格的联合搜索,然后通过两种具有非渐进收敛保证的鲁棒约束策略搜索算法来平衡约束满足和奖励最大化,最后通过计算实验来证明我们方法的优点和有效性。
Dec, 2023
本文提出利用经验对偶域学习解决受约束的统计学习问题,并使用一种实用的受约束学习算法,在社会、工业和医学领域中实现对学习的显式约束。我们在公平性和对抗鲁棒性方面的速率受限学习应用中说明了这一理论和算法。
Mar, 2021
通过元学习方法,本文研究了在非稳态环境下确保安全性的独特挑战,并采用可微凸规划的连续凸约束策略更新,以实现在受限环境中的元学习和快速任务适应。
Dec, 2023
通过统计函数镜头研究约束统计机器学习的一般问题,特别是在算法公正和机器学习领域变得越来越重要,我们考虑在特定实值函数参数等于零或受限的约束下学习一个感兴趣的函数值参数。结果表明,可获得约束参数的封闭解,从而揭示了公正预测模型的驱动机制。同时,我们提出了构建公正的机器学习算法的估计过程,该过程可以与任何统计学习方法和现成软件结合使用。
Apr, 2024
本文通过半无限优化和非凸对偶理论的研究,证明对抗性训练等价于在扰动分布上的统计问题,并对此进行完整的表征。我们提出一种基于 Langevin Monte Carlo 的混合方法,可以缓解鲁棒性与标准性能之间的平衡问题,并取得了 MNIST 和 CIFAR-10 等领域最先进的结果。
Oct, 2021
本文提出了一种代理 - 拉格朗日新公式,以及用于解决非凸或不可区分约束下的非凸模型训练问题的随机分类器算法,并在精度、覆盖率、准确性、回调和客户流失率等多个方面的实验结果证明了其效果。
Sep, 2018
本文提出一种基于 PAC 学习框架的约束学习方法,该方法通过对经验风险最小化规则进行约束来解决分类问题中的偏差、不公平和不稳定性等问题,研究表明该方法能够实现约束学习的泛化。
Jun, 2020
本研究探讨了如何通过两个数据集的两人博弈法优化模型参数,进而在满足约束条件的同时提高评估时的一般化性能,以达到公平性和减少误诊率等政策目标。实验结果表明,该方法不仅在理论上可行,而且在实际使用中也十分有效
Jun, 2018
将基于学习的技术,特别是强化学习,整合到机器人技术中来解决非结构化环境中的复杂问题很具有前景。本文展示了我们如何以原则性的方式将复杂的安全约束强加于基于学习的机器人系统中,从理论和实践的角度进行了展示。
Apr, 2024