Apr, 2017

莎士比亚第一版本中的自动排字归属

TL;DR本文介绍一种新型的无监督模型,通过分析文字和视觉特征来区分排版工人,并应用于莎士比亚的第一本(Folio)上,并且其准确性可达87%,即使是OCR输出的文本也一样。