大型语言模型作为上下文化学物质学习器

Mar, 2024

大型语言模型作为上下文化学物质学习器

Large Language Models are In-Context Molecule Learners

Jiatong Li, Wei Liu, Zhihao Ding, Wenqi Fan, Yuqiang Li...

TL;DR大型语言模型（LLM）在生物化学任务中表现出卓越的性能，特别是分子字幕翻译任务，在分子和自然语言文本之间建立联系。然而，先前的方法在将 LLM 调整到分子 - 字幕翻译任务中需要额外的领域特定预训练阶段，分子和文本空间之间的对齐性较弱，或者对 LLM 的规模有严格要求。为了解决这些挑战，我们提出了一种新的范式：上下文分子适应（ICMA），允许 LLM 通过上下文示例来学习分子 - 文本对应关系。实验证明，ICMT 可以使 LLM 在没有额外的训练语料库和复杂结构的情况下实现最先进的或相当的性能，表明 LLM 本质上是上下文中的分子学习器。

Abstract

large language models (LLMs) have demonstrated exceptional performance in biochemical tasks, especially the molecule caption translation task, which aims to bridge the gap between molecules and natural language texts. However, previous methods in adapting LLMs to the →

large language models in-context molecule adaptation molecule-caption translation cross-modal retrieval in-context molecule tuning

发现论文，激发创造

面向视觉与语言模型的多模态上下文学习

通过对一些最先进的 VLM（Visual Language Model）进行分析，我们发现它们在执行 ICL（In-Context Learning）指令时存在一定的不足。为了验证这个猜想，我们提出了一种简单但令人惊讶地有效的策略，通过扩展一个常见的 VLM 对齐框架，实现 ICL 支持、方法和课程设置。我们探讨、分析并提供了对有效数据混合的见解，从而显著提升了 21.03% 的 ICL 表现（平均 11.3%），超过了最强 VLM 基线和多种 ICL 基准，并为 VLM 的 ICL 评估贡献了新的基准，并讨论了它们相对于现有技术的优势。

Mar, 2024

基于大型语言模型的分子发现与翻译: ChatGPT 视角

本文提出了一种基于大型语言模型的框架（MolReGPT），通过检索式提示范式在上下文中进行少量评估，并利用分子相似性原理从本地数据库检索类似分子及其文本描述来启用 LLMS，用于分子说明翻译以促进分子发现

Jun, 2023

ALMol：通过离线偏好对比优化实现对齐的语言 - 分子翻译 LLM

化学和人工智能的交叉领域是一个积极研究的领域，旨在加速科学发现；该研究聚焦于机器翻译化学语言和分子模型，并采用一种新的训练方法，通过对比优化来提高模型性能。

May, 2024

反馈对齐的混合 LLMs 用于机器语言分子翻译

使用先进的优化算法和非线性融合，通过少量数据实现科学大语言模型的性能提升和新的最佳水平，并引入细粒度的评估方法来评估大语言模型中的虚构能力和促进负责任的使用。

May, 2024

大型语言模型感知语境学习用于代码生成

基于大型语言模型的代码生成中，我们提出了一种名为 LAIL 的新型学习选择方法，通过考虑给定需求和示例时生成真实程序的概率来估计候选示例，并通过概率反馈对候选示例进行标记，使用对比学习目标训练一个有效的检索器，从而提高了代码生成的性能。在 CodeGen 和 GPT-3.5 方面，LAIL 在三个代表性数据集上分别比基准线提高了 11.58％、6.89％、5.07％和 4.38％、2.85％、2.74％的 Pass@1 指标。

Oct, 2023

MolX: 使用多模态扩展增强大型语言模型在分子学习中的能力

本研究设计和装备 MolX 作为一种多模态外部模块，通过使用特定编码器从 SMILES 字符串和 2D 分子图表示中提取细粒度特征，从而增强了大型语言模型（LLMs）在理解分子方面的能力。实验结果表明，我们提出的方法在多种分子相关任务中表现出色，包括从分子到文本的翻译和分子的逆合成，无论是否对 LLM 进行微调。

Jun, 2024

多语言大型语言模型是否能够进行上下文中的文本到图像学习？

将大型语言模型从文本到多模态进化为多模态大型语言模型 (MLLMs)，并扩展了上下文学习 (ICL) 到多模态环境。本研究中提出以 T2I-ICL 为任务的新的 benchmark 数据集 CoBSAT，通过与六个最先进的 MLLMs 算法的对比表明了 T2I-ICL 的困难及其挑战，并探索了 fine-tuning 和 Chain-of-Thought prompting 等策略以实现显著改进。

Feb, 2024

让任何多模态大型语言模型都能高效地进行上下文学习

通过聚合多模态演示的图像信息到相应的语言部分的密集潜在空间，我们提出了一种称为 AIM 的通用轻量级框架来解决多模态 ICL 的两个问题。

Jun, 2024

通过双向对齐改善上下文学习

大型语言模型通过在上下文中学习（ICL）在许多任务上展示了令人印象深刻的少量样本泛化能力。本研究提出了双向对齐（BiAlign）方法，旨在充分利用模型对 ICL 示例的偏好，提高较小模型的 ICL 能力。通过与大型模型的输入偏好对齐，同时对齐令牌级别的输出分布，BiAlign 在语言理解、推理和编码等各种任务中超过了现有基准。

Dec, 2023

上下文对齐能走多远？探索上下文对齐的现状

通过分析 In-Context Alignment（ICA）的机制和适用性，本研究发现示例部分对提升模型对齐能力至关重要，同时还评估了 ICA 在不同对齐任务中的零 - shot 能力，结果显示相较于参数微调方法，ICA 在基于知识和工具应用任务上表现出更好的性能，然而在多轮对话和按指示执行任务方面仍存在某些局限性。

Jun, 2024