Nov, 2023

基于 Transformer 的光学字符识别对抗攻击的脆弱性分析

TL;DR基于 Transformer 的 OCR 模型的韧性评估表明,非定向攻击对其高度脆弱,而定向攻击相对较弱;在基准手写数据集上,非定向攻击几乎无法察觉,造成字符错误率超过 1;而具有类似扰动大小的定向攻击可以以大约 25%的成功率攻击单个标记,要求 TrOCR 从大词汇中输出第十个最可能的标记。