Dec, 2013

使用深度卷积神经网络从街景图像识别多位数

TL;DR本文提出了一种集成了多个步骤的深度卷积神经网络,直接在图像像素上解决了识别街景图像中任意多位数字的难题,并在公开数据集 SVHN 上达到超过 96% 的识别率,在识别每个数字的任务上超过了当前最先进的技术,在 reCAPTCHA 上的识别准确率为 99.8%,表明该系统在特定操作阈值下可以与甚至超过人类操作员的性能。