KMC 3: k-mer 统计及操作

Jan, 2017

KMC 3: counting and manipulating k-mer statistics

Marek Kokot, Maciej Długosz, Sebastian Deorowicz

TL;DR介绍了 KMC2 算法的显著改进 ——KMC3 以及用于操作 k-mer 数据库的 KMC 工具，这些工具的有用性在一些真实问题上得到了验证。

Abstract

Summary: Counting all k-mers in a given dataset is a standard procedure in many bioinformatics applications. We introduce KMC3, a significant improvement of the former KMC2 →

k-mers bioinformatics algorithm database tools

发现论文，激发创造

GaKCo：一种使用计数的快速 Gapped k-mer 字符串核函数

该论文提出了一种使用累计计数和关联阵列计算子字符串共出现的算法（GaKCo），用于快速分类 DNA、蛋白质和字符文本。和最先进的 gk-SK 相比，GaKCo 算法的时间复杂度独立于标兵符号数，并且实验结果表明它的精度相同，速度快两倍到四倍。

Apr, 2017

基于字符串核的序列分类的高效近似算法

本文中，我们提出了一种新的技术，能够高效准确地估计序列之间的相似度得分，从而增加了序列分类方法在音频、图像和文本序列中的应用广度，并且取得了良好的理论和实验表现。

Dec, 2017

快速收敛的任意时间模型计数

本篇论文设计了一种基于部分知识编译的新型近似模型计数方法 PartialKC，其在可伸缩性和准确性方面都表现显著优于以前的近似计数器，并可以收敛于精确计数器，实验证明其具有精确计数器可比的性能。

Dec, 2022

利用 MapReduce 进行快速聚类

本文考虑在 MapReduce 环境下设计用于处理大数据集的聚类算法，重点研究实用和流行的聚类问题，如 k-center 和 k-median，并开发具有常数因子近似保证的快速聚类算法。

Sep, 2011

高效知识编译：超越带权模型计数

本文介绍了用于解决量化扩展逻辑编程中的第二级推理任务的算法框架 Second Level Algebraic Model Counting (2AMC)，探讨了使用知识编译技术降低处理效率时的需要考虑变量阶数限制问题，进一步提出并实现了一种静态生成约束的策略，并在多个任务和基准测试上评估了有效性。

May, 2022

近似三角形计数

本文介绍了一种实用的采样算法，用于在图中计算三角形的数目，实验结果表明，此算法在处理数百万节点和边的图时表现良好，速度可提高 2800 倍到 70000 倍，并且估计精度非常高。该算法已经被实现在 Hadoop 的 Peta-Graph Mining 库中。

Apr, 2009

简单、健壮且最优排名的配对比较

本研究旨在通过成对比较的数据形式，使用 Copeland 计数算法实现对 n 个项目的排序，使其具有计算效率高，鲁棒性强，接近信息论极限等特点，并将结果扩展到汉明距离度量下的近似恢复问题和任意错误要求条件下的恢复问题。

Dec, 2015

基于中心点枢轴的完全子图计数算法

本研究提出了一种名为 Pivoter 的算法，它能够精确计算输入图中所有大小的 k-clique 的数量，并且成功地获取了之前的算法无法计算的较大的团计数，通过精简数据结构 Succinct Clique Tree 的构建，使得精确计算 k-clique 的数量和局部计数变得更加有效。

Jan, 2020

代数模型计数

介绍了代数模型计数（AMC），它是对半环结构加权模型计数（WMC）的推广。研究表明，AMC 泛化了众多领域的很多任务如概率推理，软限制和网络和数据库分析。此外，该研究还从知识编译角度研究了 AMC，并表明所有的 AMC 任务都可以使用 sd-DNNF 电路来评估。

Nov, 2012

基于概率分布距离函数的计算效率高的调制级别分类

本文提出一种基于概率分布距离函数的新颖调制水平分类方法，使用改良的 Kuiper 和 Kolmogorov-Smirnov 距离以实现低计算复杂度，并以模拟验证该方法的理论性能和使用 Kuiper 距离实现最佳分类精度。

Dec, 2010