Apr, 2024

NAF-DPM: 一个用于文档增强的非线性无激活扩散概率模型

TL;DR提出一种基于扩散概率模型 (DPM) 的新型生成框架 NAF-DPM,用于恢复被损坏文档的原始质量。通过引入高效无线激活的网络和快速求解常微分方程的采样器,减少了 DPM 的推断时间。实验证明,该方法在像素级和感知相似度度量方面达到了最先进的性能,并且增强了 OCR 系统在转录被我们框架加强的真实文档图像时的字符错误率。