Apr, 2022

文本分类中识别、检测和区分超出分布样本和对抗样本

TL;DR对比分析了文本分类模型中常见的三种输入样本:分布内、分布外和对抗样本,并提出一种基于模型隐藏表示和输出概率的简单方法,有效地区分了这三种输入样本。