Feb, 2024
BioT5+:融合 IUPAC 集成和多任务调整的通用生物理解
BioT5+: Towards Generalized Biological Understanding with IUPAC Integration and Multi-task Tuning
Qizhi Pei, Lijun Wu, Kaiyuan Gao, Xiaozhuan Liang, Yin Fang...
TL;DRBioT5 + 是一个针对生物研究和药物发现的框架,融合了多种新颖特性,包括 IUPAC 命名、来自 bioRxiv 和 PubChem 等数据源的生物文本和分子数据,以及用于处理数字数据的新颖数值标记化技术,从而将分子表示与其文本描述之间的鸿沟缩小,提供对生物实体的更全面理解,并大大提高了生物文本和生物序列的基于实践的推理能力。