关键词robust learning methods
搜索结果 - 2
- 通过实时邻近防御实现健壮的推荐
在这篇论文中,我们提出了一种通用方法 Real-time Vicinal Defense(RVD),通过利用邻近的训练数据来对模型进行微调,从而在为每个用户做推荐之前确保特定样本的鲁棒性,在实时中具有防御强度,在不改变模型结构和训练过程的情 - 通过对抗强化学习提高自动驾驶车辆控制的稳健性和安全性
该研究比较了 Robust Adversarial Reinforcement Learning 和 Neural Fictitious Self Play 算法在自动驾驶场景下的性能表现,将学习问题定义为自主系统与环境干扰之间的两人博弈,