低标签、高数据情境下的多组学嵌入自监督学习

Nov, 2023

低标签、高数据情境下的多组学嵌入自监督学习

Self-supervised learning of multi-omics embeddings in the low-label, high-data regime

Christian John Hurry, Emma Slade

TL;DR利用对比式自监督学习训练预训练的 FT-Transformer 模型，从 miRNA、mRNA 或 RPPA 表达数据中预测癌症类型。当标记样本稀缺而未标记样本众多时，相比标准的表格数据基准（XGBoost 和 CatBoost），该模型表现更好。我们还探讨了多模态模型的自监督学习，提出了一种后融合模型，其中每个组学通过自己的子网络进行处理，子网络输出求平均并传递给预训练或下游目标函数。实验证明多模态预训练可以提高单一组学的预测效果，并且对于未标记的多模态样本丰富而标记的单一组学样本稀缺的数据集，这是有用的。另外，我们还展示了分别对每个组学特定模块进行预训练的高效性。这使得该模型可以应用于大量未标记数据可用于每个组学的各种情境，但只有少数带标签样本的情况。

Abstract

Contrastive, self-supervised learning (SSL) is used to train a model that predicts cancer type from miRNA, mRNA or RPPA expression data. This model, a pretrained FT-Transformer, is shown to outperform XGBoost and CatBoost, standard benchmarks for tabular data, when labelled samples are scarce but the number of unlabelled samples is high. This is despite the

contrastive self-supervised learning cancer type prediction omics data multi-modal models unlabelled data

发现论文，激发创造

基因诱导的多模态预训练用于图像组学分类

该研究提出了一种基因诱导的多模态预训练（GiMP）框架，通过整合基因组学和全面切片图像（WSIs）进行分类任务，处理了多模态图像组合分类的主要挑战，并实现了 99.47% 的准确率。

Sep, 2023

医学图像分析的多模态自监督学习

该论文提出了一种利用多个成像模式的新型自监督方法，设计了一个多模式拼图任务以促进多种图像模式的特征表征，提出了一种利用跨模态生成技术进行多模态数据增强的方法，实验表明该方法能够提高数据效率和语义表征，广泛应用于四种不同的下游任务，并取得了领先的成果。

Dec, 2019

自我监督学习提高深度学习对 CT 图像差异的肺肿瘤分割的鲁棒性

自我监督学习（SSL）是一种从无标签数据中提取有用特征表示并在有限标记样本的下游任务中进行精细调整的方法。本论文比较了基于自然数据和自我预训练的转换器模型在医学图像分析中的鲁棒性，发现自然预训练模型对肺肿瘤分割的 CT 图像差异具有更高的适应性，同时 Swin 架构从这种预训练中受益更多。

May, 2024

如何训练您的 CheXDragon：为转移至新任务和医疗系统训练胸部 X 光模型

本研究探讨了多种监督和自我监督预训练策略在医疗图像多模式数据上的性能表现，并对其在新任务和医疗保健系统中的表现进行了评估和实验，结果表明多模式 SSL 性能优于单模式 SSL，并提供了适用于面对这些限制的场景的替代模型建议。

May, 2023

视觉学习者遇到的网络图像 - 文本对

本论文研究了基于网络图像 - 文本对数据进行自监督学习的方法，对比单模式和多模式方法在视觉转移学习任务上的表现，提出了一个可扩展的 MUlti-modal Generator 预训练方法，并在多项任务中取得了最先进的转移效果。

Jan, 2023

计算病理学中的基于转录组学指导的幻灯片表示学习

使用自监督学习和基因表达谱进行多模态预训练，Tangle 可以在组织学图像中构建幻灯片嵌入，并且在性能上优于有监督和无监督基线模型。

May, 2024

自监督多实例学习用于急性髓系白血病分类

通过自监督学习方法在血涂片中为基于 MIL 的 AML 亚型分类提供无标签数据的预训练编码器，实现与有监督预训练相媲美的性能，为 AI 基础疾病诊断领域提供了一种经济高效的解决方案。

Mar, 2024

领域内自监督学习可提高遥感图像分类

本文研究了自监督学习在遥感图像分类中的应用，使用 ViT 模型和 iBOT 框架进行预训练可以提高模型预测性能。

Jul, 2023

带有少量标注的半监督学习

本文提出一种新的 SSL 算法，通过引入转移学习和自主监督来初始化数据的表示，再利用新算法，交替拟合有标签和无标签点以降低过拟合和避免标签和无标签损失平衡的问题。实验证明，该方法在标准基准测试中表现优异，特别是在从其他任务或数据集中细化时，效果更佳。

May, 2019

低数据条件下的自监督视觉学习：一项比较评估

在相对有限 / 受约束的数据集中，通过比较实验评估了现代视觉自监督学习方法的有效性，发现针对特定领域的下游任务，在领域内的低数据量自监督预训练优于在通用数据集上进行大规模预训练，为该领域中各类自监督学习方法的性能提供了有价值的见解，并提出了直接的未来研究方向。

Apr, 2024