Apr, 2025

m-KAILIN:面向生物医学大语言模型训练的知识驱动代理科学语料提取框架

TL;DR本研究针对现有开放式注释科学语料的数量和质量不足的问题,提出了一种知识驱动的多代理框架,以支持生物医学领域的大语言模型训练。通过合作多代理架构,专门的代理基于医学主题词层级提取和合成高质量文本数据,显著提升了生物医学问答任务的表现,生成的AI准备数据集在一定程度上超越了现有先进模型。