使用有针对性的干预进行活跃因果学习,解码化学复杂性
本篇论文提出了一种基于局部相互作用模型和主动学习算法的新型机器学习算法,可以在较小的训练集上提供高精度预测,并显著减少异常值误差,从而为材料设计和药物发现等领域提供更有效的高通量筛选方法。
Sep, 2017
通过使用主动学习 (AL),可以以经济的时间和资源投入及最少的人工干预构建具有鲁棒数据效率的潜力。实现了构建可靠的数据高效势能,并在牵引谱模拟、生化分子构象搜索和 Diels-Alder 反应的时间分辨机理研究中展示了该协议的多功能性。
Apr, 2024
通过构建样本空间的表示,使用半监督主动学习方法来精细调整生成模型,使其针对目标函数进行优化,以在化学空间代理内实施,从而最大限度地增强生成的分子与蛋白质靶点之间的吸引相互作用。
Sep, 2023
介绍了一种基于 AIT 的方法,可快速识别数据生成过程的基础因果结构。该方法可用于离散和连续优化公式,并在模拟到实际数据的多个基准测试中表现出卓越的性能。(Translation: An AIT-based method is introduced to quickly identify the underlying causal structure of the data-generating process, which is applicable for both discrete and continuous optimization formulations of learning the underlying directed acyclic graph from data, and demonstrates superior performance on multiple benchmarks from simulated to real-world data.)
Sep, 2021
我们基于主动学习算法,提出了一种全自动方法,用于生成分子能量的数据集,能够支持深度学习算法 ANI 在含有 CHNO 的有机分子的所有情况下实现精确的能量和力预测。
Jan, 2018
探索机器学习(ML)方法和技术以解决各个领域中的特定挑战是必要的。本研究在化学信息学领域解决一个问题,即为预测化合物活性提供尽可能合适的解决方案。通过对 100 种不同组合的现有技术进行实验,选取满足 G-means、F1-score 和 AUC 指标等一套标准的解决方案。结果在 PubChem 的约 10,000 个化学化合物数据集上进行了测试,这些化合物根据其活性进行了分类。
Sep, 2023
本文提出使用半监督学习训练图形神经网络来归因结构 - 属性关系,并将此方法应用于溶解度和分子酸度两个案例研究,以验证其与已知实验化学数据的一致性。该方法可为活性崖、引物优化和新药设计等问题提供有价值的工具。
Jan, 2022
该论文介绍了一种基于深度学习技术的神经网络模型 DESMILES,其可以用于药物发现中的分子设计,实验结果表明 DESMILES 比现有模型更有效地改进了输入分子,降低了失败率,并可用于修改分子以促进其在不同受体中的结合亲和力。
Feb, 2020
使用领域知识为 Qm9 数据集的分子离子化能量预测选择高效的训练集和 ML 技术,通过最大化训练集中分子的多样性,提高线性和非线性回归技术(如核方法和图神经网络)的鲁棒性,并基于速率扭曲解释框架的模型不可知解释器来检查图神经网络的预测可靠性。
Jun, 2023
利用深度学习技术构建的新型机器学习模型,对多种输入数据进行分类任务,包括有机和无机化合物,并在 Matbench 和 Moleculenet 基准数据集上进行开发和测试,揭示了化合物的底层模式。该模型在分子和材料数据集上表现出很高的预测能力,并在 Tox21 数据集上实现了 96% 的平均准确率,比之前最好结果提高了 10%。
Sep, 2023