霍格沃茨的药剂师机器学习
本文针对具有烹饪偏好但对于特定菜肴的食材知识不足的用户提出了个性化食谱生成的新任务:将菜品名称和不完整的食材详情扩展为与用户历史喜好相符的完整自然文本说明。通过技术和食谱级别的表示,我们的模型在一个注意力融合层中融合了这些 “用户感知” 的表示,控制食谱文本的生成。在一个新的包含 180K 份菜谱和 700K 个交互的数据集上进行实验,与非个性化的基准相比,我们的模型能够生成一些合理且个性化的菜谱。
Aug, 2019
本文介绍了一种基于深度学习算法的化学性质预测方法,使用仅为分子的二维结构图像,该方法可以用于毒理,活性和溶解度等方面的预测,并已在专家开发的 QSAR/QSPR 深度学习模型中达到了匹配的性能。
Jun, 2017
本研究提出了一个名为 “3A2M + 烹饪食谱数据集” 的数据集,其中包含 200 万个带有从食谱描述中提取的扩展命名实体的烹饪食谱,该数据集包括标题、命名实体识别、步骤和扩展命名实体等各种特征,并使用两个命名实体提取工具扩展了命名实体识别列表以解决食谱指令中缺失的命名实体,如热量、时间或过程,同时通过传统机器学习、深度学习和预训练语言模型将食谱分类为相应的风格,并达到了 98.6%的整体准确率。研究结果表明,标题特征在分类风格时起到了更重要的作用。
Oct, 2023
本研究介绍了如何利用一次性学习来大幅降低药物研发预测所需的数据量,通过引入深度学习框架 DeepChem 的新架构残留 LSTM 嵌入和图卷积神经网络的组合,该方法在小分子化合物距离度量上取得了显著的进展。
Nov, 2016
本研究采用七种不同的算法通过临床和人口统计学数据开发和测试机器学习模型,精确预测癫痫手术的预后,研究表明,基于机器学习的手术前的患者临床特征预测模型,能够精确地预测难治性病人的癫痫手术结果。通过挑选特征子集数据挖掘的监督分类机器学习策略可达到更好的预测效果,同时机器学习预测模型的发展为个性化医疗提供了必要的基础。
Feb, 2023
通过使用小样本数据集进行基于机器学习方法的分子属性预测,研究发现使用消息传递神经网络(PaiNN)以及 SOAP 分子描述符与梯度提升回归树方法相结合的简单分子描述符能够获得最佳预测结果。进一步提出了一种使用大样本数据进行预训练,并在原始数据集进行微调的迁移学习策略,以获取更准确的模型。该策略在 Harvard Oxford Photovoltaics 数据集(HOPV,HOMO-LUMO 间隙)获得了出色结果,在 Freesolv 数据集(溶剂化能)上由于复杂的学习任务和用于预训练和微调标签的不同方法而不成功。研究还发现,预训练数据集的大小与最终训练结果并非单调改善的关系,更少的预训练数据点可能导致预训练模型的偏置更高,从而在微调后获得更高的准确性。
Apr, 2024
本研究旨在提出一种基于规则知识训练的 ChemNet 神经网络,从大规模未标记化的化学数据库中进行弱监督学习,通过迁移学习的方法对化学性质进行预测,并证明其相比于常规监督学习的深度神经网络模型具有更高的准确性,同时不受网络结构类型限制。该预训练 ChemNet 的应用可以通过整合化学领域知识,实现对新型化学性质预测的更为精确和系统化。
Dec, 2017