Feb, 2024

推进生成模型评估:OCR 系统中逼真图像合成和比较的新算法

TL;DR本研究提出了一种新颖的算法,主要针对生成模型中合成图像的真实性进行客观评估。该算法通过改进 Fréchet Inception Distance(FID)得分,显著提高了评估方法的精确性,特别针对生成和评估阿拉伯手写数字的真实图像的挑战。我们的算法为此领域的 OCR 的发展奠定了基础,并为高质量合成图像的生成和评估设立了新的标准,从而不仅可以比较不同的生成模型,还为它们的设计和输出提供改进的途径。