VLM4Bio：评估预训练视觉-语言模型在生物图像特征发现中的基准数据集

Aug, 2024

VLM4Bio：评估预训练视觉-语言模型在生物图像特征发现中的基准数据集

VLM4Bio: A Benchmark Dataset to Evaluate Pretrained Vision-Language Models for Trait Discovery from Biological Images

M. Maruf, Arka Daw, Kazi Sajeed Mehrab, Harish Babu Manogaran, Abhilash Neog...

TL;DR本研究解决了利用预训练的视觉-语言模型（VLMs）帮助科学家回答与生物相关的问题的有效性缺口。通过创建一个包含30,000幅图像和469,000个问答对的独特数据集VLM4Bio，评估了12种最先进的VLMs，并探讨了提示技术和推理幻觉对模型性能的影响。研究表明，当前的SOTA VLMs在生物图像分析领域具有显著的应用潜力。

Abstract

Images are increasingly becoming the currency for documenting Biodiversity on the planet, providing novel opportunities for accelerating scientific discoveries in the field of organismal biology, especially with the advent of large →

发现论文，激发创造

神经自然主义者：生成细粒度图像比较

介绍了一个名为Birds-to-Words的新数据集，包含用自然语言描述鸟类的语句，使用了一种新的分层抽样方法，提出了一个名为神经博物学家（Neural Naturalist）的模型来生成，评估结果表明，神经模型具有用自然语言解释视觉嵌入空间中差异的潜力，并为机器学习提供了一条资助公民科学家保护生物多样性的具体路径。

Sep, 2019

用于高效物种检测的LiT调整模型

该论文提出了一种适用于分布式视觉语言预训练的简单方法，并在具有挑战性的iNaturalist-2021数据集上实现了零样本分类精度，从而打开了在涉及物种检测的农业相关应用中利用高质量视觉-语言预训练模型的新途径。

Feb, 2023

评估领先的大型语言模型在推理生物学问题中的潜力

该研究评估了领先的大型语言模型（LLMs），包括GPT-4、GPT-3.5、PaLM2、Claude2和SenseNova对概念生物学问题的回答能力。结果表明，GPT-4在逻辑推理方面表现出色，并具备数据分析、假设生成和知识整合等能力，从而有望在生物学研究中发挥作用，但还需要进一步的发展和验证。

Nov, 2023

BIOCLIP：生命之树的视觉基础模型

树生命-1000万数据集及BioCLIP模型的开发和评估，证明其在获取生物学图像中具有较强的泛化能力和优越的性能。

Nov, 2023

超越人类视角: 大型视觉语言模型在显微镜图像分析中的作用

在这项研究中，我们对 ChatGPT、LLaVA、Gemini 和 SAM 进行了分类、分割、计数和 VQA 任务，发现 ChatGPT 和 Gemini 能够令人印象深刻地理解显微镜图像中的视觉特征，而 SAM 则在一般情况下具备分离伪影的能力，但性能还不如领域专家 - 这些模型在图像中存在的杂质、缺陷、伪影重叠和多样性的引入会给其带来困扰。

May, 2024

关于利用生物学问题的大型语言模型的推理能力和可访问性的调查

本文讨论了过去十年在生物医学和大型语言模型方面取得的进展，还讨论了自然语言处理技术和工具如何与生物医学相结合。最后，通过引入一系列新的问题和提示，本文旨在对去年一项调查的结果进行扩展，以 quantifying 大型语言模型的推理能力改进以及普通用户所感受到的改进程度。此外，本文还通过要求大型语言模型深入回答开放性问题，扩展了生物文献检索的研究领域。

May, 2024

LAB-Bench: 测量生物研究语言模型的能力

评估自然语言处理模型在科学研究中的能力，引入了 Language Agent Biology Benchmark (LAB-Bench)，并且报告了与人类专家生物学研究者进行比较的结果。

Jul, 2024

BioRAG：一种用于生物问题推理的RAG-LLM框架

本研究针对生命科学研究中的问答系统面临的知识维持和信息检索挑战，提出了BioRAG框架。该框架采用新的检索增强生成(RAG)与大型语言模型(LLM)相结合的方式，通过解析和索引2200万篇科学论文，构建了领域特定的知识层级，显著提高了在生物问题推理方面的准确性和效率。

Aug, 2024

BioRAG：用于生物问题推理的检索增强生成框架

本研究针对生命科学研究中问答系统面临的知识存储和信息检索挑战，提出了一种新颖的检索增强生成（RAG）与大型语言模型（LLM）框架BioRAG。通过解析、索引和分块2200万篇科学论文，并结合领域特定的知识层级，BioRAG显著提升了信息检索和推理能力，实验结果表明其在多个生命科学问答任务中优于现有的模型。

Aug, 2024

FullAnno：增强多模态大语言模型图像理解的数据引擎

本研究解决了多模态大语言模型（MLLMs）在监督微调阶段对高质量数据的依赖问题。提出的FullAnno系统是一种数据引擎，能够生成大规模、高质量的图像注释，显著提高了数据的精细度与丰富性，实验表明其生成的注释能显著提升LLaVA-v1.5的性能。

Sep, 2024