T 细胞受体蛋白序列与稀疏编码:一种癌症分类的新方法
通过简单的对比编码 T 细胞受体(TCR)的主要序列,提出了一种名为 SCEPTR 的 TCR 语言模型,它能够进行高效的数据转移学习,并且通过独特的预训练策略结合自对比学习和掩码语言建模的方法,取得了最先进的性能,从而解码了 TCR 特异性规则。
Jun, 2024
我们提出了一种蒙版语言模型(tcrLM),用于预测 T 细胞受体(TCR)与抗原的结合,通过训练 tcrLM 来推断被屏蔽的片段,从 TCR 序列中提取表达特征,并在大规模 COVID-19 pTCR 结合测试集上超过当前最先进的方法,有效预测免疫疗法反应和临床结果。
Jun, 2024
本研究提出了一种基于 transformer 的神经网络 TCR 来预测抗癌药物的反应,利用注意力机制学习了药物子结构和分子签名之间的相互作用,同时设计了双重损失函数和交叉采样策略以提高预测能力,实验结果表明 TCR 优于其他方法,在独立的体外实验和体内实验中表现出显著的预测效果,具有癌症药物再利用和精准肿瘤治疗的潜在价值。
Jul, 2022
T 细胞受体(TCR)是适应性免疫系统的关键组成部分,负责通过识别寄主细胞表面上呈现的表位序列来响应威胁。本研究提出了 ActiveTCR,这是一个结合主动学习和 TCR - 表位结合亲和力预测模型的框架,旨在通过减少注释成本来提高性能,并展示了首次对 TCR - 表位结合亲和力预测数据优化的系统性研究。
Oct, 2023
我们研究了特定给定肽段的 T 细胞反应的预测,这对于个性化癌症疫苗的开发来说可能是一个关键步骤。我们使用了转换器模型进行 T 细胞反应预测,发现膨胀的预测性能不仅仅是理论上的问题,而是在实践中发生的。因此,我们提出了一个领域感知的评估方案,并研究了不同的迁移学习技术来处理多领域结构和捷径学习。我们证明了一种基于源的细调方法在各种肽源上都有效,并进一步证明我们的最终模型优于现有的最先进方法,用于预测人类肽段的 T 细胞反应。
Mar, 2024
MATE-Pred 是一种高度可靠的新方法,通过多模式注意力机制预测 T 细胞受体和表位结合亲和力,展示了多模式模型在从氨基酸残基中高效捕捉上下文、物理化学和结构信息的潜力,以及在各种药物发现方案中的潜在应用。
Dec, 2023
我们提出了一种名为 UnifyImmun 的统一交互注意力变换器模型,它同时预测抗原与 HLA 和 TCR 分子的结合,从而更全面评估抗原免疫原性,并且我们的方法比现有方法在两个任务上表现更好。
Apr, 2024
精准医学中,准确且稳健的药物反应预测至关重要。我们引入 TransCDR,利用迁移学习学习药物表示,并通过自注意机制融合药物和细胞系的多模态特征,预测细胞系对药物的 IC50 值或敏感状态。TransCDR 在预测上显示出比 8 种最先进模型更好的泛化能力,通过在不同情景下从头训练药物编码器的 5 个变体(即 RNN 和 AttentiveFP),TransCDR 的表现也超越其它模型。Extended Connectivity Fingerprint 和基因突变是多种药物标记和组学特征中最关键的贡献因素。此外,基于注意力的融合模块进一步增强了 TransCDR 的预测性能。在 GDSC 数据集上训练的 TransCDR 在外部测试集 CCLE 上表现出强大的预测性能。同时,我们还通过将 TCGA 的 7,675 名患者分类为药物敏感组和药物耐药组,进行基因集富集分析来研究药物反应的生物机制。TransCDR 是一种强大的工具,在药物反应预测中具有重要潜力。源代码和数据可在此 URL 中访问。
Nov, 2023
提出了一种高效的基于 Transformer 的框架,利用 ESM、ProtBert、BioBERT 和 SciBERT 四种不同的 Transformer 模型从氨基酸序列中检测抗癌肽,实验证明该模型在准确率上优于现有研究,为抗癌肽研究确定了新的最先进水平。
Jan, 2024