- PharmGPT:面向生物制药和化学领域的特定领域大型语言模型
PharmGPT is a suite of multilingual LLMs specifically trained on a comprehensive corpus tailored to the Bio-Pharmaceutic - 多选题自动生成和标记的知识组件
我们使用 GPT-4 为高等教育课程中的化学和电子学习的多项选择题生成知识组件 (KCs),并通过三名领域专家的评估,分析了大型语言模型 (LLM) 生成的 KCs 与人工生成的 KCs 之间的差异。评估结果显示,非匹配的 KCs 中,评估 - 反馈对齐的混合 LLMs 用于机器语言分子翻译
使用先进的优化算法和非线性融合,通过少量数据实现科学大语言模型的性能提升和新的最佳水平,并引入细粒度的评估方法来评估大语言模型中的虚构能力和促进负责任的使用。
- ALMol:通过离线偏好对比优化实现对齐的语言 - 分子翻译 LLM
化学和人工智能的交叉领域是一个积极研究的领域,旨在加速科学发现;该研究聚焦于机器翻译化学语言和分子模型,并采用一种新的训练方法,通过对比优化来提高模型性能。
- LlaSMol:通过大规模、综合、高质量的指导调整数据集推进化学领域的大型语言模型
我们研究了基于 SMolInstruct 数据集进行 fine-tune 的大型语言模型在化学任务上表现出色,特别是 Mistral 模型,同时,我们还分析了可训练参数的影响,为未来的研究提供了一些见解。
- 化学 LLM: 一种化学大型语言模型
ChemLLM 是第一个专门用于化学领域的大型语言模型,通过使用结构化化学知识构建对话系统,能够在化学学科中顺畅交互完成各种任务,包括名称转换、分子标题和反应预测,并在相关数学和物理任务中展现出出色的适应性。
- IJCAI从词语到分子:化学中大型语言模型的调查
将大型语言模型 (LLMs) 整合到化学领域是一个复杂的任务,本文以细致的方法论探索了该跨学科领域的复杂性和创新,从分子信息如何通过各种表示和标记方法导入 LLMs 开始,将化学 LLMs 分为三个不同的群体,并讨论了将这些输入整合到 LL - 非对称对比多模态学习推进化学理解
ACML 是一种新颖的方法,通过有效的不对称对比学习,将来自不同化学模态的信息无缝传递到分子图表示中,进而提供了综合的表示学习和高效训练,增强了学到的表示的可解释性并支持图神经网络的表达能力。通过实际任务,如同分异构体鉴别和揭示药物发现的关 - 应用 XAI 和大型语言模型提取化学中人类可解释的结构 - 性质关系
提出了 XpertAI 框架,将 XAI 方法与大型语言模型相结合,以访问科学文献,自动生成原始化学数据的易于理解的自然语言解释。通过进行 5 个案例研究来评估 XpertAI 的性能,结果表明 XpertAI 将大型语言模型和 XAI 工 - 利用机器学习准确处理全球气候模型中的重叠混杂物种
我们研究了化学和辐射在普适环流模型中的耦合,并比较了不同混合方法的效果,发现基于 DeepSets 的机器学习方法在 GCM 使用中精确且高效,而其他方法可能需要用于加速大气检索。
- 再评估合成路线的算法与 Syntheseus
近年来,如何综合分子的规划,即背向合成,已成为机器学习和化学领域关注的焦点之一。然而,现有技术存在系统性缺陷,由于缺乏完善的基准和一致的比较方法而被掩盖。为解决这个问题,我们提出了一个名为 syntheseus 的基准库,以默认方式促进最佳 - 通过自主实验进行定制纳米颗粒合成和化学知识发现
本研究提出了一种自主实验平台,用于设计具有目标光学特性的纳米颗粒(NPs),并展示了该平台在银(Ag)NPs 合成中的应用,表明该平台能够高效地生成具有所需吸收光谱的 Ag NPs,并进一步揭示了柠檬酸调控竞争将会影响吸收光谱形状的新型化学 - 14 个 LLM 应用案例:揭示大型语言模型黑客马拉松对材料科学与化学的转化
使用大型语言模型解决化学和材料科学中的数据驱动或计算技术的复杂性,从而在各种应用中包括分子和材料的属性预测、设计工具和从非结构化数据中提取知识等领域中产生了巨大的成功。参加的人们利用大型语言模型进行了各种各样的应用,这表明大型语言模型将深刻 - GPT 模型在化学方面能做什么?八项任务的综合评估
本文针对大语言模型在化学领域能力的未知,建立起一个包含 8 个化学实践任务的全面基准,运用 GPT-4、GPT-3.5 和 Davinci-003 三种 GPT 模型以零样本和少样本的情境下进行测试,发现 GPT-4 相较于其他两种模型表现 - 在材料领域中量化高维非监督聚类任务中等向性的度量
本研究提出了一种基于现有推导的新型方法,通过对反应物的不同表征和聚类算法进行全面分析,可以量化簇的各向同性度量以及各向同性的平均度量,并在 Inorganic Crystal Structure Database 和 MNIST 数据集上进 - KineticNet: 深度学习转移动能能量泛函应用于无轨道密度泛函理论
使用 KineticNet 深度神经网络对轨道自由密度泛函理论中的动能能量进行建模,通过分子平面网格预测分子的动能能量函数,以获得具有化学准确性的模型,从而实现轨道自由密度泛函理论的密度优化,以及对小分子的基态分子属性计算。
- ICML分子关系学习的条件图信息瓶颈
本文提出了一种基于图神经网络,利用条件图信息瓶颈检测关键次级结构的分子关系学习方法,从而能更好地模拟化学反应,实验证明它在不同任务和数据集上比同类算法更具优势。
- 形状(几乎)是全部!持久同调特征是高效分子机器学习信息丰富的输入
本文研究了持久性同调在分子结构方面的应用,通过创建编码分子形状的持久性同调特征(PHFs),成功地简化了化学问题,提高了机器学习的效率以及信息密度,为今后类似领域的研究提供了借鉴。
- 利用多任务语言建模统一分子和文本表示
提出了一种多领域、多任务的语言模型,能够处理化学和自然语言,并共享模型参数来优化实验室操作和科学发现加速。
- MMSELFIES 与分子链表示法的未来
该研究探讨了化学中的自然语言处理与机器学习的应用,重点介绍了一种新的分子语言 SELFIES,并提出了 16 个具体的未来项目计划,以发掘分子字符串表示在化学和材料科学中的潜力。