基因组学中的经典到量子序列编码

Apr, 2023

基因组学中的经典到量子序列编码

Classical-to-Quantum Sequence Encoding in Genomics

Nouhaila Innan, Muhammad Al-Zafar Khan

TL;DR本文介绍了在生物信息学中使用多种数学领域的算法进行古典到量子数据编码的新颖方法，其中包括无损压缩、小波编码和信息熵技术，并提出了基于量子玻尔兹曼机的 DNA 序列编码测试方法，为量子计算在生物信息学中的发展提供了新的思路和应用。

Abstract

dna sequencing allows for the determination of the genetic code of an organism, and therefore is an indispensable tool that has applications in Medicine, Life Sciences, Evolutionary Biology, Food Sciences and Technology, and Agriculture. In this paper, we present several novel methods

dna sequencing quantum data encoding bioinformatics lossless compression quantum boltzmann machines

发现论文，激发创造

量子数据编码：经典到量子映射技术的比较分析及其对机器学习准确性的影响

该研究探索了将量子数据嵌入技术与经典机器学习算法相结合，旨在评估在各种模型上的性能增强和计算效果。我们探索了多种经典到量子的映射方法，包括基编码、角度编码和幅度编码，通过对包括逻辑回归、K 近邻、支持向量机以及随机森林、LightGBM、AdaBoost 和 CatBoost 在内的流行机器学习算法进行广泛的实证研究，发现量子数据嵌入有助于改善分类准确性和 F1 分数，尤其在与增强特征表示有关的模型中表现突出。我们观察到运行时间方面存在微妙的影响，低复杂度模型展示了适度的增加，而计算复杂度更高的模型则经历了明显的变化。值得注意的是，集成方法在性能提升和计算开销之间表现出有利的平衡。该研究强调了量子数据嵌入在增强经典机器学习模型方面的潜力，并强调了在性能改进与计算成本之间权衡的重要性。未来的研究方向可能涉及优化计算效率的量子编码过程以及在实际应用中的可扩展性。我们的工作为量子计算和经典机器学习交叉领域的不断增长的知识贡献了见解，为寻求利用量子启发技术的研究人员和实践者提供了洞察。

Nov, 2023

数据编码对变分量子机器学习模型表达能力的影响

本文研究了数据编码策略对参数化量子电路作为函数逼近器的表达能力的影响，发现量子模型可以被自然地写成数据的部分傅里叶级数，通过多次反复简单的数据编码门，量子模型可以访问越来越丰富的频率光谱，发现存在一些量子模型可以实现所有可能的傅里叶系数集，因此如果可访问频谱足够丰富，则这些模型是通用函数逼近器。

Aug, 2020

量子分类器的强健数据编码

该论文研究了数据编码在量子机器学习模型中的作用，证明了其在决策边界和噪音数据处理中的重要性，并定义了鲁棒数据编码的概念，并提供了数值结果以验证所述发现。

Mar, 2020

DNA 序列压缩分类

通过压缩算法为基础的新的分类方法在 DNA 序列分析中表现出高准确性和更高效的特点，为基因组研究和应用领域带来了潜在的进展。

Jan, 2024

VQDNA: 多物种基因组序列建模的向量量化能力释放

引入了 VQDNA，一个从基因词汇学习的角度改进基因标记化的通用框架；通过利用可学习的词汇的向量量化码书，VQDNA 可以自适应地将基因标记化为具有模式感知的嵌入结果；通过在层次结构中设计不同尺度的码书，提出了层次残差量化方法（HRQ）。在 32 个基因数据集上的广泛实验表明，与现有的基因语言模型相比，VQDNA 具有卓越的性能和有利的参数效率。值得注意的是，对 SARS-CoV-2 突变的经验分析揭示了学习 HRQ 词汇的细粒度模式感知和生物学意义，突显了其在基因组学中更广泛应用的潜力。

May, 2024

使用自编码器在合成 DNA 上储存图像

本研究介绍了基于卷积自编码器的失真图像压缩方法，将图像编码成四元编码并存储到合成的 DNA 分子中，提高了压缩模型对于 DNA 存储中错误导致失真的鲁棒性。

Mar, 2022

统计推断的最优通用量子编码

利用量子计算，研究经典数据在统计推断中的最佳编码。寻找一种适用于各种统计推断任务的优化编码器。通过量子编码，实证任何统计推断的准确性都被一个与量子编码中的经典数据最大泄漏成比例的项上界所限制，这表明最大量子泄漏是统计推断编码策略质量的普适度量，仅取决于数据的量子编码而不依赖于推断任务本身。证明了最佳的普适编码策略，即最大化最大量子泄漏的编码策略，是通过纯态实现的。当量子比特足够多时，基底编码被证明是普遍最优的。提出了一种迭代方法，用于数值计算最佳的普适编码策略。

Apr, 2024

具有编码数据结构的变分量子回归算法

我们构建了一个量子回归算法并确定了变分参数与学习回归系数之间的直接关系，利用直接将数据编码到反映经典数据表结构的量子振幅的电路。该算法适用于连接良好的量子比特，具有对数级时间复杂度优势，并提供了与传统一热编码技术相比所需的物理比特数量显著减少的压缩二进制编码方法，同时还能进行非线性回归。通过在实践中从量子回归模型学习中进行重要特征选择的集成模型训练，我们能够减小硬件噪音的影响。

Jul, 2023

在量子计算机上对时尚 - MNIST 数据集进行分类

量子机器学习算法对工业应用的潜在影响仍然是一个激动人心的待解问题，我们尝试通过改进一种近期提出的变分算法，用当前可用的量子计算机的本机门集合和拓扑结构逼近准备编码数据，将该算法应用于 Fashion-MNIST 数据集，并在当前量子计算机上部署简单的量子变分分类器对编码的数据集进行训练，实现了中等精度的结果，为我们的数据编码方法的近期可用性提供了概念验证。

Mar, 2024

量子视觉特征编码再探讨

通过研究量子机器学习在计算机视觉中的应用，本文发现现有的量子编码设计未能保证在编码过程后信息特征的保留，给量子机器学习模型的学习过程带来了复杂性，同时也导致了一个被称为 “量子信息差距” 的问题，该问题直接影响了量子机器学习算法的性能。为了解决这个挑战，我们引入了一种名为量子信息保持的简单而高效的新损失函数（QIP），以最小化这个差距，从而提升了量子机器学习算法的性能。广泛实验证明了我们的方法的有效性，相比当前方法，提供了卓越的性能，并始终在量子建模中取得了最先进的结果。

May, 2024