BriefGPT.xyz
Ask
alpha
关键词
wasserstein ball
搜索结果 - 4
Wasserstein 不确定性下的马尔科夫决策过程稳健 Q 学习算法
我们提出了一种新的 $Q$-learning 算法,用于解决分配鲁棒的马尔可夫决策问题。我们证明了算法的收敛性,并提供了几个示例来说明我们算法的可处理性以及考虑分布稳健性在解决随机最优控制问题时的好处,尤其是在实践中估计的分布出现错误时。
PDF
2 years ago
ICLR
基于 Wasserstein 分布鲁棒优化的类别条件域泛化
本文介绍一种基于分布鲁棒优化的分类器,在 Wasserstein 球内最优化条件分布的最坏情况下,增强条件分布领域泛化的鲁棒性,并利用迭代算法自动学习 Wasserstein 球半径,实验表明该方法比传统领域泛化方法在未知目标领域中表现更好
→
PDF
3 years ago
一种分布鲁棒的公平分类方法
提出了一种具有不公平惩罚的分布鲁棒逻辑回归模型,可以使用 Wasserstein ball 来对分布不确定性进行建模以实现公平机会并提高公平性。
PDF
4 years ago
ICLR
通过有原则的对抗训练证明一些分布鲁棒性
利用分布鲁棒优化的方式解决神经网络在对抗攻击下的鲁棒性问题,通过在 Wasserstein ball 内惩罚扰动数据分布的方式,通过我们提出的训练过程,能够实现对训练数据的最坏情况扰动而获得中等水平的健壮性,同时具有较小的计算和统计成本,并
→
PDF
7 years ago
Prev
Next