Sep, 2023

大规模预训练提高了基于主动学习的分子虚拟筛选的样本效率

TL;DR预训练的基于转换器的语言模型和图神经网络在贝叶斯优化主动学习框架中表现良好,仅通过筛选超大型库中的 0.6%,可以识别到排名前 50000 位化合物的 58.97%,与先前的最先进基准相比提高了 8%,在结构基础和配体基础药物发现中具有卓越的性能,可提高基于主动学习的分子虚拟筛选的准确性和样本效率。