- ICLR部分已知因果图的干预公平性:一种约束优化方法
本文提出了一种基于干预的因果公平性框架,用于在部分已知因果图的情况下实现公平预测,该方法使用部分有向无环图(PDAG)来度量因果公平性,并制定一个受限制的优化问题来平衡公平性和准确性。模拟和真实数据集的结果证明了该方法的有效性。
- 大型语言模型的必要且充分水印
提出了 NS-Watermark 方法用于在生成的文本中插入水印,以区分由大型语言模型还是人类编写的文本。该方法通过约束优化问题来生成更自然的文本,并在机器翻译任务中相较于现有的水印方法取得高达 30 BLEU 分数的性能优势。
- 针对随机策略的无信赖区域策略优化
本文提出了一个名为 TREFree 的算法,该算法采用广义代理目标来替代策略上的可信区间约束并在实践中通过保守优化广义目标来有效实施,从而获得更好的策略绩效和样本效率。
- 利普希茨价值迭代的异策略区间估计
研究提出了用于获得一般连续情况下离线策略评估的区间界限的可证明正确的方法,该方法基于搜索与观察一致的所有 Lipschitz Q 函数中期望奖励的最大和最小值,进而引入了 Lipschitz 值迭代方法以加紧区间,可以在一定程度上提高部分高 - RC-DARTS: 资源受限的可微分架构搜索
本文提出了资源限制下的可微架构搜索方法 (RC-DARTS),以较小的模型尺寸和计算复杂度实现与最先进方法相当的性能,并通过对 Cifar10 和 ImageNet 数据集的实验进行了验证。
- 安全强化学习的收敛策略优化
本研究探讨了安全强化学习问题与非线性函数逼近的关系,将策略优化作为同时考虑目标与限制的非凸问题,通过构建一系列局部替换非凸函数为凸二次函数的约束优化问题,证明了对这些问题求解,其解会收敛于原问题的稳定点;进一步将该算法应用于优化控制和多智能 - PC-Fairness: 基于因果关系公平的统一框架
本研究提出了一种计算因果公平性的框架,其中定义了一个旨在涵盖前期因果公平概念的统一定义,并使用约束优化问题对路径特定反事实公平性进行了界定,以解决可辨识性的问题,实验表明了本方法的正确性和有效性。
- 在 VAEs 中学习分层先验
本文提出了在变分自编码器中学习分层先验以避免标准正态先验分布造成的过度规则化。为了激励数据的具有信息的潜在表示,我们将学习问题公式化为带有约束的优化问题,并将 Taming VAEs 框架扩展为两层分层模型。我们引入了基于图形的插值方法,该 - 公平约束下的分类问题:一种可证明有效性的元算法
本文介绍了一个新的元分类算法来解决涉及多个非不相交敏感属性的具有公正性限制的分类问题,该算法具有可证明的保证,该算法能够实现几乎完美的公平性,而且所带来的准确性损失通常很小。
- MM使用基于神经网络的约束优化对人脸检测器进行对抗性攻击
本文提出了一种新的对抗生成网络(adversarial generator network)求解约束优化问题来产生对抗性样本的策略,该方法经过简单训练后线性扩展的能力很强,可以攻击还未曾见过的新图片,使用此技术针对 Faster R-CNN - 语义对抗样本
本文提出了一种新类的对抗样本 ——“语义对抗样本”,即通过对图像进行任意扰动来欺骗模型,但修改后的图像在语义上代表的仍是原始图像,通过构建约束优化问题和基于人类认知系统的形状偏置特性的对抗变换,生成对抗图像的颜色转移极大影响了 Deep n - 具有对抗约束的弱监督 3D 重建
本文研究使用前景掩码作为弱监督,通过光线追踪池化层实现透视投影和反向传播的三维重建,同时限制重建到未标记的能匹配覆盖面的真实三维形状。通过该方法可以使用 GAN 训练现有工具。我们通过各种数据集进行单视角和多视角重建的实验和分析表明,我们约 - 可证明的有界最优智能体
本篇论文提出了有限最优性作为一种人工智能的理论基础,该理论基础通过解决机器架构和任务环境的约束优化问题来定义程序的最优性,以在实时环境下构建智能体,其中包括使用自动化邮件排序设施模型来说明结果。