生成用于回答模拟问题的代码的假设

Apr, 2022

生成用于回答模拟问题的代码的假设

What If: Generating Code to Answer Simulation Questions

Gal Peretz, Kira Radinsky

TL;DR本研究提出了一种基于 DSL 和强化学习的神经程序合成方法，通过运行时语义相似性奖励实现了化学反应过程的模拟，从而获得了88％的准确性提升。

Abstract

Many texts, especially in chemistry and biology, describe complex processes. We focus on texts that describe a chemical reaction process and questions that ask about the process's outcome under different environmental conditions. To answer questions about such processes, one needs to u

发现论文，激发创造

翻译中的发现”：使用神经序列到序列模型预测复杂有机化学反应的结果

该研究介绍了一种基于序列到序列模型的无模板反应预测方法，使用一种新型的可扩展标记方法，不涉及反应模板等辅助知识，达到了80.1%的准确率，其核心思想是运用语言学分析的思维方式来解决有机化学问题。

Nov, 2017

利用语法和强化学习进行神经程序合成

本文提出了两种新的方法来解决程序合成中的限制，分别通过增加语义正确生成的概率和语法正确的程序的概率来解决。

May, 2018

利用多任务语言建模统一分子和文本表示

提出了一种多领域、多任务的语言模型，能够处理化学和自然语言，并共享模型参数来优化实验室操作和科学发现加速。

Jan, 2023

代码合成的自动生成单元测试数据与演员-评论者强化学习

自动获取适用于代码合成模型的强化学习训练数据，结合简单而有效的演员-评论家强化学习训练方案，提高预训练代码语言模型的性能。

Oct, 2023

蒙特卡洛思维搜索：大型语言模型在催化剂设计中进行复杂科学推理

通过蒙特卡洛树搜索方法与科学推理，提出了一种新的驱动组合搜索的方法，可以增强科学家的推理和发现过程。

Oct, 2023

化学LLM: 一种化学大型语言模型

ChemLLM是第一个专门用于化学领域的大型语言模型，通过使用结构化化学知识构建对话系统，能够在化学学科中顺畅交互完成各种任务，包括名称转换、分子标题和反应预测，并在相关数学和物理任务中展现出出色的适应性。

Feb, 2024

ReactXT：通过反应上下文化的分子-文本预训练理解分子之“反应关系

分子-文本建模是一个新兴的研究方向，旨在通过文本界面和文本知识促进与分子相关的任务。针对单个分子之外，研究反应-文本建模对于帮助合成新材料和药物具有潜力，然而，以往的研究大多忽视了反应-文本建模。为了解决这些挑战，我们提出了一种新的预训练方法ReactXT，用于反应-文本建模，并提供了一个新的数据集OpenExp，用于实验过程预测。我们的方法在实验过程预测、分子字幕生成和逆向合成方面表现出一致的改进，并取得了竞争性的结果。

May, 2024

SciCode: 科学家为之策划的研究编码基准

Contemporary language models' progress towards becoming helpful scientific assistants is demonstrated by SciCode, a scientist-curated coding benchmark that examines their capabilities in generating code for solving real scientific research problems.

Jul, 2024

用于自动化过程工程计算的检索增强指令调整：具有可归因反思的工具链问题解决框架

本研究针对过程工程计算缺乏基础AI模型的问题，提出了一种新的自主智能体框架，利用检索增强指令调整（RAIT）技术提升小型代码语言模型（SLMs）。研究表明，该框架的性能可与大型专有模型相媲美，具备更好的可解释性和成本效益，能够有效解决特定的过程工程任务。

Aug, 2024

MathDSL：一种用于简洁数学解决方案的领域特定语言

本研究解决了数学方程求解中的表达简洁性问题，提出了一种新颖的领域特定语言MathDSL，相比于现有的基于强化学习的方法，其在准确性和简洁性上均有显著提升。主要发现表明，使用MathDSL的程序合成系统DreamCoder能够生成更高质量的解决方案，并在数学教育中具有潜在应用价值。

Sep, 2024