Mar, 2024

应用量子张量网络进行蛋白质分类

TL;DR蛋白质序列可以被看作自然语言处理中的句子,并且可以使用现有的量子自然语言处理框架解析为合理量子比特的参数化量子电路,这些电路可以被训练用于解决各种与蛋白质相关的机器学习问题。论文提出了适应蛋白质数据需求的详细方法,通过全面的实验结果支持,展示了两种不同的量子张量网络(QTN),并使用经典循环神经网络(RNN)和卷积神经网络(CNN)的灵感来解决所提到的二元分类任务。我们的最佳量子模型的准确率达到 94%,与使用 ESM2 蛋白质语言模型嵌入的经典模型性能相媲美,而我们最好的量子模型仅需要约 800 个参数。研究表明,这些混合模型表现出有希望的性能,展示了它们与类似复杂度的经典模型竞争的潜力。