Apr, 2022

一种基于 Apache Spark 的可扩展的新型蛋白质序列特征提取方法及其聚类性能分析

TL;DR本文提出了两种基于Apache Spark的可扩展特征提取方法60d-SPF和6d-SCPSF,以及将预处理后的巨大蛋白质序列输入到聚类算法中的方法。实验证明,与现有的特征提取方法相比,60d-SPF在聚类算法SRSIO-FCM和SLFCM中的提取效果显着更好。