Jan, 2024

多模态表示学习用于分子属性预测:序列、图形、几何

TL;DR本文提出了一种新的数据增强技术,通过修改分子图的拓扑结构生成具有与原始数据相同的分子连通性索引的增强数据,结合数据增强技术和分子连通性索引能够保留更多基于拓扑结构的分子性质信息并生成更可靠的数据,通过使用五个基准数据集测试表明,基于重要的分子拓扑特征生成的增强数据可以有效提高分子性质的预测准确度,这也为化学信息学研究中的数据增强提供了新的视角。