Sep, 2023

无监督学习的盲生物序列去噪

TL;DR无监督集合学习(SSSL)方法能够在没有直接观察到干净的源序列标签的情况下,将亚读物聚集在嵌入空间中并估计单个集合嵌入作为亚读物在潜在空间和序列空间中的中点,从而实现对生物序列进行准确去噪。该方法在模拟的长读长 DNA 数据和真实的抗体序列数据集上表现出优于基准方法的去噪性能,为高通量 DNA 测序数据在下游科学应用中的潜力提供更好的实现。