May, 2022

高风险可靠性的对抗训练

TL;DR通过对抗训练,可以增加高风险环境下 AI 安全性,本文以安全语言生成任务为测试,使用一系列对抗训练技术来寻找并消除分类器中的错误,提高输出的鲁棒性和可靠性。