Apr, 2024

有限监督的原子级光学化学结构识别

TL;DR通过图形表示或图像识别分子的化学结构是一项具有挑战性的模式识别任务,在药物开发方面具有很大的好处。我们提出了一种新的化学结构识别工具,该工具提供了最先进的性能,并可以适应少量数据样本和监督下的新领域。与以前的方法不同,我们的方法提供了原子级定位,因此可以将图像分割成不同的原子和键。我们的模型是第一个只使用 SMILES 监督进行原子级实体检测的 OCSR 模型。通过严格和广泛的基准测试,我们证明了我们的化学结构识别方法在数据效率、准确性和原子级实体预测方面的卓越性。