生成用于回答模拟问题的代码的假设
该研究介绍了一种基于序列到序列模型的无模板反应预测方法,使用一种新型的可扩展标记方法,不涉及反应模板等辅助知识,达到了80.1%的准确率,其核心思想是运用语言学分析的思维方式来解决有机化学问题。
Nov, 2017
ChemLLM是第一个专门用于化学领域的大型语言模型,通过使用结构化化学知识构建对话系统,能够在化学学科中顺畅交互完成各种任务,包括名称转换、分子标题和反应预测,并在相关数学和物理任务中展现出出色的适应性。
Feb, 2024
分子-文本建模是一个新兴的研究方向,旨在通过文本界面和文本知识促进与分子相关的任务。针对单个分子之外,研究反应-文本建模对于帮助合成新材料和药物具有潜力,然而,以往的研究大多忽视了反应-文本建模。为了解决这些挑战,我们提出了一种新的预训练方法ReactXT,用于反应-文本建模,并提供了一个新的数据集OpenExp,用于实验过程预测。我们的方法在实验过程预测、分子字幕生成和逆向合成方面表现出一致的改进,并取得了竞争性的结果。
May, 2024
Contemporary language models' progress towards becoming helpful scientific assistants is demonstrated by SciCode, a scientist-curated coding benchmark that examines their capabilities in generating code for solving real scientific research problems.
Jul, 2024
本研究针对过程工程计算缺乏基础AI模型的问题,提出了一种新的自主智能体框架,利用检索增强指令调整(RAIT)技术提升小型代码语言模型(SLMs)。研究表明,该框架的性能可与大型专有模型相媲美,具备更好的可解释性和成本效益,能够有效解决特定的过程工程任务。
Aug, 2024
本研究解决了数学方程求解中的表达简洁性问题,提出了一种新颖的领域特定语言MathDSL,相比于现有的基于强化学习的方法,其在准确性和简洁性上均有显著提升。主要发现表明,使用MathDSL的程序合成系统DreamCoder能够生成更高质量的解决方案,并在数学教育中具有潜在应用价值。
Sep, 2024