Oct, 2023

卷积双向变分自编码器用于点阵阿拉伯数字到图像领域翻译

TL;DR该论文提出了一种Ladder Bottom-up Convolutional Bidirectional Variational Autoencoder (LCBVAE)架构的方法,用于对点阵阿拉伯到期日期的图像转换,通过将阿拉伯点阵到期日期重建为实填日期进行训练。通过使用定制并适应了我们特定需求的Convolutional Recurrent Neural Network CRNN模型并使用2019年至2027年间的实填图像对其进行训练,提取到期日期并评估LCBVAE模型在到期日识别上的表现,该流程可以集成到自动化分类系统中,用于提取到期日期并相应地对产品进行分类。此外,该方法可以解决商家手动输入到期日期的低效性和耗时性问题。在我们的研究中,通过扩大下游转化学习任务中的潜在瓶颈层的大小(增加到1024),展示了改善泛化性能的重要性。使用LCBVAE架构进行图像转换,该方法在图像转换方面达到了97%的准确率,并可以推广应用于其他图像转换和重建的下游学习任务。