基于知识的机械学习对先兆子痫基因组的增值
为构建更准确、更好解释的遗传医学机器学习模型,我们引入了“PANTHER”,一种通常由molecular mechanisms编码的遗传途径的高阶特征学习的非负张量分解技术,我们将“PANTHER”应用于疾病类型的softmax分类器训练中,并对其进行了评估
Dec, 2020
本研究提出了一种基于GPT模型的新的基因集功能摘要方法,该方法使用结构化文本、自由叙述基因概要或直接模型检索等来源来生成GO术语列表,但并不能依靠本方法来代替标准术语富集分析,手动筛选方法仍然必要。
May, 2023
本文利用因果发现算法和大型语言模型通过对 705 名乳腺癌患者的基因组信息的剖析,从多个角度研究患者存活状况的因素,表明因果发现算法和语言模型的可靠性,有助于深入挖掘临床应用上的可靠因果关系。
May, 2023
使用大型语言模型MapperGPT进行术语资源的对齐和实体映射,在结构和词汇信息的基础上,与高检索率的方法相结合,能够显著提高准确性,超过LogMap等现有方法。
Oct, 2023
利用图机器学习方法构建了一个由81,488个独特的转录因子级联组成的知识图谱,研究发现转录因子之间的复杂相互作用以及其对基因表达的调控作用,通过路径富集分析找出与癌症、发育、细胞信号等多个功能类别相关的途径,从而为研究特定转录因子的研究者提供宝贵的信息,为治疗与转录因子失调相关的疾病提供潜在的干预目标,同时为理解转录因子之间的复杂相互作用和调控角色提供了有价值的资源。
Nov, 2023
该研究提出了一个新颖的benchmarking框架Dyport,用于评估生物医学假设生成系统。利用经过筛选的数据集,在真实条件下测试这些系统,增强了我们评估的相关性。我们将筛选数据库中的知识整合到动态图中,并伴随着一种量化发现重要性的方法。这不仅评估了假设的准确性,还评估了它们在生物医学研究中的潜在影响,这显著扩展了传统的链接预测基准。我们的benchmarking过程的适用性在应用于生物医学语义知识图上的几个链接预测系统上得到了证明。我们的灵活性benchmarking系统旨在广泛应用于假设生成质量验证,旨在扩大生物医学研究界的科学发现范围。Dyport框架完全开源,所有代码和数据集都可以在此https的URL中获得。
Dec, 2023
引入了一种基于两步正-未标记学习范式的新型基因优先排序方法,该方法首先使用基于相似性的类KNN方法从没有已知DR关系的基因中选择可靠的负例,然后使用这些可靠的负例和所有已知的正例来训练一个分类器,该分类器能够有效区分DR相关和非DR相关的基因,从而生成更可靠的有关新颖DR相关性的有前途的基因排名。这种方法在三个相关性能指标上明显优于现有的非正-未标记方法用于DR相关性预测。此外,对现有文献的整理发现,我们模型确定的排名靠前的候选DR相关基因得到了支持。
Jun, 2024
通过RUGGED (Retrieval Under Graph-Guided Explainable disease Distinction) 协议,整合和提取生物医学信息,预测药物和疾病之间的潜在联系,从而支持临床研究员在知识整合和假设生成方面作出准确的推荐和指导,针对心律失常性心肌病和扩张型心肌病进行药物评估和推荐,减少大型语言模型的幻觉,提供可行的见解,并改善对新型治疗方法的研究。
Jul, 2024
本研究针对年龄相关性黄斑变性(AMD)中的视网膜下纤维化严重程度的分子机制缺乏了解的问题,提出了一种基于机器学习的框架,旨在预测与损伤严重程度强相关的关键基因,并识别潜在的治疗靶点。通过对JR5558小鼠视网膜的原始RNA测序数据进行分析,研究开发了新颖的特征工程技术,结果表明该框架能够有效识别新的治疗靶点,为药物开发和改善AMD的治疗策略提供了重要见解。
Sep, 2024