植物生物学中的大型语言模型
基于大型语言模型(LLMs)的研究和应用在生物信息学领域有着巨大潜力和效力,该研究通过分析各种关键生物信息学任务,证明了 LLMs(如 GPT 变体)在给定适当提示的情况下可以成功处理大多数任务,同时也分析了在复杂生物信息学任务中的局限性。
Feb, 2024
对大型语言模型(LLMs)进行了综述,包括三个流行的 LLM 系列(GPT,LLaMA,PaLM)的特点、贡献和局限性,同时讨论了构建和增强 LLMs 的技术、为 LLM 训练、微调和评估准备的常用数据集以及常用的 LLM 评估指标,最后讨论了未来的挑战和研究方向。
Feb, 2024
通过对多个 LLM 模型的研究,本文不仅提供了全面的概述,还明确了现有挑战,并指出了未来的研究方向。该综述提供了关于生成型人工智能的当前状态的全面观点,为进一步的探索、增强和创新提供了启示。
Mar, 2024
基于转换器架构的大型语言模型(LLMs)在基因组学中扮演了转变性的角色。本文旨在成为对基因组数据感兴趣的计算生物学家和计算机科学家的指南,同时也希望为生物学家们介绍和讨论我们将来如何分析基因组数据的基本转变。
Nov, 2023
大型语言模型 (LLMs) 在增强自然语言理解方面具有变革性的力量,代表着朝着人工通用智能迈出的重要一步。科学 LLMs 是一个新兴的领域,专门针对促进科学发现进行工程化设计。本文详细调查了科学 LLMs,并围绕生物化学领域进行了深入研究,包括文本知识、小型分子、大分子蛋白质、基因组序列以及它们的组合,从模型架构、能力、数据集和评估等方面进行了分析。最后,我们批判性地审查了当前的挑战,并指出了前景广阔的研究方向以及 LLMs 的进展。通过提供对该领域技术发展的全面概述,本调查力求成为研究人员在科学 LLMs 复杂领域中的宝贵资源。
Jan, 2024
本论文介绍了 PLLaMa,这是一个开源的语言模型,它从 LLaMa-2 演变而来,通过包含超过 150 万篇植物科学论文的全面数据库,大大丰富了 PLLaMa 在植物和农业科学领域的知识和能力。我们的初步测试显示,PLLaMa 在理解与植物科学相关的主题方面得到了显著改善。此外,我们还组建了一个国际专业小组,包括植物科学家、农业工程师和植物育种专家,他们在验证 PLLaMa 对各种学术问题的回答准确性方面起着重要作用,确保其在实际应用中的有效性和可靠性。为了支持进一步的研究和开发,我们将模型的检查点和源代码提供给科研界,可在 https://github.com/Xianjun-Yang/PLLaMa 进行下载。
Jan, 2024
该研究评估了领先的大型语言模型(LLMs),包括 GPT-4、GPT-3.5、PaLM2、Claude2 和 SenseNova 对概念生物学问题的回答能力。结果表明,GPT-4 在逻辑推理方面表现出色,并具备数据分析、假设生成和知识整合等能力,从而有望在生物学研究中发挥作用,但还需要进一步的发展和验证。
Nov, 2023
大型语言模型(LLMs)如 ChatGPT 因其通用的语言理解能力而备受关注,尤其是它们生成高质量文本或计算机代码的能力。在本文中,我们讨论它们在何种程度上可以辅助数学专家,并提供了现代语言模型中使用的变压器模型的数学描述。基于最近的研究,我们概述了最佳实践和潜在问题,并报告了语言模型的数学能力。最后,我们揭示了 LLMs 改变数学家工作方式的潜力。
Dec, 2023