Apr, 2022
一种基于 Apache Spark 的可扩展的新型蛋白质序列特征提取方法及其聚类性能分析
A Novel Scalable Apache Spark Based Feature Extraction Approaches for
Huge Protein Sequence and their Clustering Performance Analysis
TL;DR本文提出了两种基于Apache Spark的可扩展特征提取方法60d-SPF和6d-SCPSF,以及将预处理后的巨大蛋白质序列输入到聚类算法中的方法。实验证明,与现有的特征提取方法相比,60d-SPF在聚类算法SRSIO-FCM和SLFCM中的提取效果显着更好。