Dec, 2013
使用深度卷积神经网络从街景图像识别多位数
Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks
Ian J. Goodfellow, Yaroslav Bulatov, Julian Ibarz, Sacha Arnoud, Vinay Shet
TL;DR本文提出了一种集成了多个步骤的深度卷积神经网络,直接在图像像素上解决了识别街景图像中任意多位数字的难题,并在公开数据集 SVHN 上达到超过 96% 的识别率,在识别每个数字的任务上超过了当前最先进的技术,在 reCAPTCHA 上的识别准确率为 99.8%,表明该系统在特定操作阈值下可以与甚至超过人类操作员的性能。