基因组学中的经典到量子序列编码
该研究探索了将量子数据嵌入技术与经典机器学习算法相结合,旨在评估在各种模型上的性能增强和计算效果。我们探索了多种经典到量子的映射方法,包括基编码、角度编码和幅度编码,通过对包括逻辑回归、K 近邻、支持向量机以及随机森林、LightGBM、AdaBoost 和 CatBoost 在内的流行机器学习算法进行广泛的实证研究,发现量子数据嵌入有助于改善分类准确性和 F1 分数,尤其在与增强特征表示有关的模型中表现突出。我们观察到运行时间方面存在微妙的影响,低复杂度模型展示了适度的增加,而计算复杂度更高的模型则经历了明显的变化。值得注意的是,集成方法在性能提升和计算开销之间表现出有利的平衡。该研究强调了量子数据嵌入在增强经典机器学习模型方面的潜力,并强调了在性能改进与计算成本之间权衡的重要性。未来的研究方向可能涉及优化计算效率的量子编码过程以及在实际应用中的可扩展性。我们的工作为量子计算和经典机器学习交叉领域的不断增长的知识贡献了见解,为寻求利用量子启发技术的研究人员和实践者提供了洞察。
Nov, 2023
本文研究了数据编码策略对参数化量子电路作为函数逼近器的表达能力的影响,发现量子模型可以被自然地写成数据的部分傅里叶级数,通过多次反复简单的数据编码门,量子模型可以访问越来越丰富的频率光谱,发现存在一些量子模型可以实现所有可能的傅里叶系数集,因此如果可访问频谱足够丰富,则这些模型是通用函数逼近器。
Aug, 2020
引入了 VQDNA,一个从基因词汇学习的角度改进基因标记化的通用框架;通过利用可学习的词汇的向量量化码书,VQDNA 可以自适应地将基因标记化为具有模式感知的嵌入结果;通过在层次结构中设计不同尺度的码书,提出了层次残差量化方法(HRQ)。在 32 个基因数据集上的广泛实验表明,与现有的基因语言模型相比,VQDNA 具有卓越的性能和有利的参数效率。值得注意的是,对 SARS-CoV-2 突变的经验分析揭示了学习 HRQ 词汇的细粒度模式感知和生物学意义,突显了其在基因组学中更广泛应用的潜力。
May, 2024
本研究介绍了基于卷积自编码器的失真图像压缩方法,将图像编码成四元编码并存储到合成的 DNA 分子中,提高了压缩模型对于 DNA 存储中错误导致失真的鲁棒性。
Mar, 2022
利用量子计算,研究经典数据在统计推断中的最佳编码。寻找一种适用于各种统计推断任务的优化编码器。通过量子编码,实证任何统计推断的准确性都被一个与量子编码中的经典数据最大泄漏成比例的项上界所限制,这表明最大量子泄漏是统计推断编码策略质量的普适度量,仅取决于数据的量子编码而不依赖于推断任务本身。证明了最佳的普适编码策略,即最大化最大量子泄漏的编码策略,是通过纯态实现的。当量子比特足够多时,基底编码被证明是普遍最优的。提出了一种迭代方法,用于数值计算最佳的普适编码策略。
Apr, 2024
我们构建了一个量子回归算法并确定了变分参数与学习回归系数之间的直接关系,利用直接将数据编码到反映经典数据表结构的量子振幅的电路。该算法适用于连接良好的量子比特,具有对数级时间复杂度优势,并提供了与传统一热编码技术相比所需的物理比特数量显著减少的压缩二进制编码方法,同时还能进行非线性回归。通过在实践中从量子回归模型学习中进行重要特征选择的集成模型训练,我们能够减小硬件噪音的影响。
Jul, 2023
量子机器学习算法对工业应用的潜在影响仍然是一个激动人心的待解问题,我们尝试通过改进一种近期提出的变分算法,用当前可用的量子计算机的本机门集合和拓扑结构逼近准备编码数据,将该算法应用于 Fashion-MNIST 数据集,并在当前量子计算机上部署简单的量子变分分类器对编码的数据集进行训练,实现了中等精度的结果,为我们的数据编码方法的近期可用性提供了概念验证。
Mar, 2024
通过研究量子机器学习在计算机视觉中的应用,本文发现现有的量子编码设计未能保证在编码过程后信息特征的保留,给量子机器学习模型的学习过程带来了复杂性,同时也导致了一个被称为 “量子信息差距” 的问题,该问题直接影响了量子机器学习算法的性能。为了解决这个挑战,我们引入了一种名为量子信息保持的简单而高效的新损失函数(QIP),以最小化这个差距,从而提升了量子机器学习算法的性能。广泛实验证明了我们的方法的有效性,相比当前方法,提供了卓越的性能,并始终在量子建模中取得了最先进的结果。
May, 2024