Feb, 2024

BioT5+:融合 IUPAC 集成和多任务调整的通用生物理解

TL;DRBioT5 + 是一个针对生物研究和药物发现的框架,融合了多种新颖特性,包括 IUPAC 命名、来自 bioRxiv 和 PubChem 等数据源的生物文本和分子数据,以及用于处理数字数据的新颖数值标记化技术,从而将分子表示与其文本描述之间的鸿沟缩小,提供对生物实体的更全面理解,并大大提高了生物文本和生物序列的基于实践的推理能力。