May, 2024

学习字符串序列

TL;DR采用通用相似度度量(USM)作为 K - 最近邻(K-NN)学习器中的替代距离度量,有效地识别可变长度序列数据,并与常用的字符串 - 词向量方法进行对比实验证明,USM 方法较字符串 - 词向量方法在垃圾邮件过滤和蛋白质亚细胞定位等领域的预测具有更高的准确性,并可生成可靠的概率预测。