Nov, 2023

ChemScraper: PDF图像的图像提取,分子图解析和带注释数据生成

TL;DR从born-digital PDF分子图像中提取符号并应用简单图形转换,以编辑ChemDraw文件(CDXML),其直接位置和形状信息使得该方法具有高准确性的解析能力,以生成训练数据用于识别栅格图像中的化学结构的视觉解析器。