Aug, 2023
通过序列相似性和上下文进行改进的矢量嵌入:用于 cDNA 图书馆的压缩、相似性搜索、聚类、组织和操作
Vector Embeddings by Sequence Similarity and Context for Improved Compression, Similarity Search, Clustering, Organization, and Manipulation of cDNA Libraries
Daniel H. Um, David A. Knowles, Gail E. Kaiser
TL;DR通过基因的有组织数值表示,可以更高效地对序列进行聚类,并通过编码条形码和 cDNA 序列的序列嵌入方法和欧氏空间向量接近算法来改善相似性搜索的时间复杂性。